среда, 3 марта 2010 г.

[prog.c++] Пустой массив в структуре

Когда-то давным-давно, изучая программирование под Windows, встречал иногда вот такой фокус:

struct some_struct_t
   {
      int field_1;
      ...
      int field_N;
      char last_field[];
   };

Т.е. последним полем структуры является массив без объявления размерности. Использовалась эта штука для работы с данными переменной длины. Например, прочитали из файла/сокета блок данных, привели указатель на него к нашему типу, и пошли циклом по последнему полю:

char raw_data[ SOME_LIMIT ];
read_data( raw_data, sizeof( raw_data ) );
const some_struct_t * data =
      reinterpret_cast< const some_struct_t * >( raw_data );
for( size_t i = 0; i != data->field_K; ++i )
   if( XXX == data->last_field[ i ] )
      ...

Такой хак использовался когда-то в C, а потом достался в наследство C++. Ну и ладно бы, никогда к нему не прибегал. А на днях пришлось объяснять человеку, что когда он пишет вот так:

struct info_t
   {
      char * name[];
   };
info_t info;
for( size_t i = 0; i != ...; ++i )
   info.name[ i ] = new char[...];

то это, мягко говоря, не совсем правильно. Поскольку память под name никто не выделял, но наглым образом использует.

При этом я открыл для себя интересную штуку: оказывается, C++ компилятор под поле info_t::name вообще не выделяет места! Т.е. я думал, что при такой записи в info_t под поле name будет отведено место на один char*. Но нет! В Visual C++ 2003-2008 размер всей структуры info_t – всего один(!) байт (что и понятно, поскольку объектов с нулевым размером быть не должно). А вот в GCC 4.3.2 из cygwin-а размер info_t все-таки нулевой.

Вот такие дела. Век живи – век учись, дураком помрешь ;)

2 комментария:

  1. Этот момент в стандарте прописан. В C99 - раздел 6.7.2.1.16:

    As a special case, the last element of a structure with more than one named member may
    have an incomplete array type; this is called a flexible array member. In most situations,
    the flexible array member is ignored. In particular, the size of the structure is as if the
    flexible array member were omitted except that it may have more trailing padding than
    the omission would imply. However, when a . (or ->) operator has a left operand that is
    (a pointer to) a structure with a flexible array member and the right operand names that
    member, it behaves as if that member were replaced with the longest array (with the same
    element type) that would not make the structure larger than the object being accessed; the
    offset of the array shall remain that of the flexible array member, even if this would differ
    from that of the replacement array. If this array would have no elements, it behaves as if
    it had one element but the behavior is undefined if any attempt is made to access that
    element or to generate a pointer one past it.


    Насколько я понимаю, здесь утверждается, что нет чёткой гарантии будет или не будет сколько-то места, но если специально место не выделялось, то стоит предполагать, что его там нет.

    ОтветитьУдалить
  2. Спасибо за цитату. Я предполагал, что это стандартизированная штука. Но знатоком стандартов никогда не был.

    ОтветитьУдалить