Вопросы о длине данных сокета

У меня есть пара вопросов, связанных со следующим кодом:

char buffer[256];
memset(buffer,0,256);

read(socket_fd,buffer,255);

Вопросы:

Почему я читаю 255, а не 256?
Допустим, я хочу отправить слово: «Круто» от клиента к серверу. Сколько байтов я должен записать «на клиенте» и сколько байтов я должен прочитать «на сервере»?

Я действительно смущен.

c linux sockets network-programming

15.11.2010

Ты и вполовину не так сбит с толку, как я 15.11.2010

Ответы:

У вас уже есть хорошие ответы здесь, но я думаю, что есть концепция, которую мы должны объяснить.

Когда вы отправляете данные через потоки (то есть что-то, что записывает некоторое количество байтов с одного конца, и эти байты могут быть прочитаны в том же порядке с другого конца), вы почти всегда хотите знать, когда прекратить чтение. Это обязательно, если вы будете отправлять более одного сообщения: когда заканчивается первое сообщение и начинается второе? В потоке все смешивается.

Итак, как мы разграничиваем сообщения? Есть три простых способа (и много других, конечно, не таких простых):

1 Сообщения фиксированной длины. Если вы заранее знаете, что каждое сообщение имеет длину, скажем, 10 байт, то у вас нет проблем. Вы только что прочитали 10 байтов, а 11-й будет частью другого сообщения. Это очень просто, но и очень жестко.

2 символа-разделителя или строки. Если вы отправляете удобочитаемый текст, вы можете разделить свои сообщения так же, как вы разделяете строки в char*: поставив в конце символ 0. Таким образом, когда вы читаете 0, вы знаете, что сообщение закончилось, а все оставшиеся данные в потоке принадлежат другому сообщению.

Это нормально для текста ascii, но когда дело доходит до произвольных данных, это также довольно жестко: есть символ или последовательность символов, которые не могут содержаться в ваших сообщениях (иначе ваша программа запутается в том, где заканчивается сообщение) .

3 заголовка сообщения: это лучший подход для сообщений произвольной длины и произвольного содержания. Перед отправкой любых фактических данных сообщения отправьте заголовок фиксированной длины (или используйте метод № 2, чтобы отметить конец заголовка), указав метаданные о вашем сообщении. Например, это длина.

Скажем, вы хотите отправить сообщение «Круто», как вы сказали. Ну, сначала отправьте байт (или 2-байтовый короткий, или 4-байтовое целое число, или что-то еще), содержащий «4», длину сообщения, и получите его на другом конце. Вы знаете, что прежде чем прибудет какое-либо сообщение, вы должны прочитать 1 байт (или 20, или 4, или что-то еще), поэтому сохраните его где-нибудь, а затем прочитайте оставшиеся указанные байты.

Очень простой пример:

struct mheader {
    int length;
};

(...)
struct mheader in_h;
read(fd, &in_h, sizeof(struct mheader);

if (in_h.length > 0)
    read(fd, buffer, in_h.length)

Надеюсь, поможет. Удачи!

15.11.2010

Так что буфер сохраняет NUL в конце, как дополнительную страховку от переполнения строки. Чтение 256 позволит перезаписать его.
Вы бы написали пять байтов. Либо напишите "Cool\0", либо напишите 4 (длина), а затем 4 символа в «Cool». Прочтите все это и вычислите длину после.

15.11.2010

Вы смотрите на возвращаемое значение от read(); он сообщает вам, сколько байтов было прочитано.

Вы используете количество прочитанных байтов, когда хотите записать те же данные.

Вам не нужно использовать 255 при чтении, если вы определенно не хотите иметь возможность поставить NUL в конце, но, поскольку вы знаете, сколько байтов было прочитано, вы все равно не пойдете дальше этого. Итак, 255 — это страховка от невнимательности программиста.

memset() также является страховкой от небрежности программиста - в действительности это не обязательно, если только вы не хотите скрыть предыдущие конфиденциальные данные.

15.11.2010

Новые материалы

Коллекции публикаций по глубокому обучению

Последние пару месяцев я создавал коллекции последних академических публикаций по различным подполям глубокого обучения в моем блоге https://amundtveit.com - эта публикация дает обзор 25..

Представляем: Pepita

Фреймворк JavaScript с открытым исходным кодом Я знаю, что недостатка в фреймворках JavaScript нет. Но я просто не мог остановиться. Я хотел написать что-то сам, со своими собственными..

Советы по коду Laravel #2

1-) Найти // You can specify the columns you need // in when you use the find method on a model User::find(‘id’, [‘email’,’name’]); // You can increment or decrement // a field in..

Работа с временными рядами спутниковых изображений, часть 3 (аналитика данных)

Анализ временных рядов спутниковых изображений для данных наблюдений за большой Землей (arXiv) Автор: Рольф Симоэс , Жильберто Камара , Жильберто Кейрос , Фелипе Соуза , Педро Р. Андраде ,..

3 способа решить квадратное уравнение (3-й мой любимый) -

1. Методом факторизации — 2. Используя квадратичную формулу — 3. Заполнив квадрат — Давайте поймем это, решив это простое уравнение: Мы пытаемся сделать LHS,..

Создание VR-миров с A-Frame

Виртуальная реальность (и дополненная реальность) стали главными модными терминами в образовательных технологиях. С недорогими VR-гарнитурами, такими как Google Cardboard , и использованием..

Демистификация рекурсии

КОДЕКС Демистификация рекурсии Упрощенная концепция ошеломляющей О чем весь этот шум? Рекурсия, кажется, единственная тема, от которой у каждого начинающего студента-информатика..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Software Development Python Coding Deep Learning AI React Software Engineering Nodejs Front End Development Java Algorithms Computer Science Typescript Data Tech Development CSS HTML Programming Languages Tutorial Angular Startup Productivity Python Programming Computer Vision Neural Networks Education Open Source Javascript Tips AWS NLP Learning Developer