четверг, 5 сентября 2019 г.

Что такое __wchar_t (с двумя ведущими подчёркиваниями) и почему у меня вылезают связанные с ним ошибки?

Это перевод What is __wchar_t (with the leading double underscores) and why am I getting errors about it? Автор: Реймонд Чен.

Компилятор Microsoft Visual C++ имеет параметр компилятора с названием /Zc:wchar_t, который позволяет вам контролировать, что же означает тип wchar_t.

Согласно стандарту C++, wchar_t - это отдельный родной (встроенный, нативный) тип, и именно так по умолчанию считает компилятор Visual C++. Тем не менее, вы можете передать /Zc:wchar_t-, и это отключит встроенное определение типа wchar_t, позволяя вам определить тип так, как вам нравится. А для Windows это исторически означает:
typedef unsigned short wchar_t;
потому что Windows предшествует версиям стандартов C и C++, которые представили wchar_t как собственный тип.

Так что теперь у вас есть проблема, если вы пишете библиотеку, которая будет использоваться как кодом старой школы, написанным с wchar_t, определённым как псевдоним для unsigned short, так и кодом новой школы, написанным с wchar_t как отдельным внутренним типом. Какой тип данных вам нужно использовать для строковых параметров?

Что ж, если ваша библиотека использует C-линковку, то вам повезло. Поскольку встроенный тип wchar_t является в Visual C++ 16-разрядным целым числом без знака, то он двоично совместим с unsigned short, и поэтому вы можете объявить в заголовочном файле вашу функцию как принимающую wchar_t, и каждый клиент будет интерпретировать её через свой собственный вариант типа wchar_t: код, который использует /Zc:wchar_t, увидит родной тип wchar_t. Код же с /Zc:wchar_t- увидит unsigned short. А поскольку C-линковка не декорируется, вы можете экспортировать одну функцию, которая принимает wchar_t, и она будет совместима с любым определением.

Итак, это будет работать для функций без декорирования, но как насчёт языков типа C++, которые используют декорирование для кодирования типов параметров? Какой тип вам нужно использовать?

Let's do both.

Что вам следует сделать - так это написать два (overload) варианта вашей функции, одна из которых будет использовать unsigned short, а другая - __wchar_t. Этот загадочный __wchar_t представляет собой "родной тип для wchar_t, который используется /Zc:wchar_t".

Иными словами, включение опции /Zc:wchar_t указывает компилятору сделать так (скрытно):
typedef __wchar_t wchar_t;
что сделает символ wchar_t псевдонимом для внутреннего встроенного типа __wchar_t.

Допустим, у вас есть функция DoSomething, которая принимает широкую строку, и вы хотите работать с клиентами, скомпилированными с любым вариантом параметра /Zc:wchar_t:
// Something.h

bool DoSomething (const __wchar_t* s);
bool DoSomething (const unsigned short* s);
Этот код объявляет две версии функции. Первый вариант будет соответствовать коду, скомпилированному с /Zc: wchar_t. Второй вариант будет соответствовать коду, скомпилированному с /Zc:wchar_t-.

А реализация выглядит так:
// Something.cpp
#include <Something.h>

bool DoSomethingWorker(const wchar_t* s)
{
 ... настоящая реализация ...
}

bool DoSomething(const __wchar_t* s)
{
    return DoSomethingWorker(reinterpret_cast<const wchar_t*>(s));
}

bool DoSomething(const unsigned short* s)
{
    return DoSomethingWorker(reinterpret_cast<const wchar_t*>(s));
}
Как отмечалось выше, вызывающий, собранный с /Zc:wchar_t, будет использовать первый вариант DoSomething, а вызывающий, собранный с /Zc:wchar_t-, будет использовать второй. Но оба они в итоге вызывают общую реализацию, которую мы объявляем с помощью wchar_t, так что она соответствует настройке /Zc:wchar_t, используемой самой библиотекой.

Итак, ответ на изначальный вопрос: __wchar_t - это имя внутреннего типа данных для широких строк. Если вы компилируете с /Zc:wchar_t, то это тот тип данных, на который отображается wchar_t. "Смешное" имя существует для того, чтобы код, скомпилированный с /Zc:wchar_t-, также мог бы получить к нему доступ. Ну и чтобы тот код, который хочет не зависеть от /Zc:wchar_t, тоже мог бы явно ссылаться на внутренний родной тип.

Комментариев нет:

Отправить комментарий

Можно использовать некоторые HTML-теги, например:

<b>Жирный</b>
<i>Курсив</i>
<a href="http://www.example.com/">Ссылка</a>

Вам необязательно регистрироваться для комментирования - для этого просто выберите из списка "Анонимный" (для анонимного комментария) или "Имя/URL" (для указания вашего имени и ссылки на сайт). Все прочие варианты потребуют от вас входа в вашу учётку.

Пожалуйста, по возможности используйте "Имя/URL" вместо "Анонимный". URL можно просто не указывать.

Ваше сообщение может быть помечено как спам спам-фильтром - не волнуйтесь, оно появится после проверки администратором.

Примечание. Отправлять комментарии могут только участники этого блога.