OB

Полевое редактирование и кодирование данных

Редактирование включает в себя просмотр и, если необходимо, исправление каждой анкеты или формы наблюдений. Просмотр и внесение исправлений зачастую выполняются в две стадии: полевое редактирование и централизованное офисное редактирование.
Полевое редактирование — это предварительное редактирование, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза пропуски и неточности данных.
В идеальных обстоятельствах полевое редактирование выполняется как можно скорее после того, как анкета или другая форма сбора данных заполнена. В этом случае проблемы могут быть устранены прежде, чем проводивший сбор информации штат будет расформирован, и пока конкретные контакты, явившиеся источником затруднения, еще свежи в памяти проводивших опрос или наблюдение людей. Полевое редактирование обычно выполняется руководителем полевых работ. Необходимо проверять:
1. Полнота - тщательное просматривание формы данных с целью обеспечения уверенности в том, что ни один раздел или страница не пропущены.
2. Удобочитаемость - важно кодировать анкету, которая не может быть сведена к цифровой форме, чтобы избежать проблемы неразборчивости почерка или непонятных сокращений слов.
3. Вразумительность - иногда зарегистрированные ответы невразумительны для всех, кроме того, кто проводил опрос в поле.
4. Логическая последовательность.
5. Единообразие.
За полевым редактированием обычно следует централизованное офисное редактирование, которое заключается в более полной и точной проверке и коррекции собранных ответов. Чтобы обеспечить логическую последовательность обработки материалов, лучше всего предоставить все носители собранных данных одному человеку. Если эту работу приходится делить по соображениям ее объема и имеющегося времени, подразделы должны определяться по частям анкеты, а не по респондентам.
Редактор должен решить, каким образом будут обрабатываться носители собранных данных, содержащие неполные ответы, явно неправильные ответы и ответы, которые отражают утрату интереса.
Исследования, в которых все вернувшиеся анкеты заполнены целиком, редки. В некоторых окажутся пропущенными целые разделы. Другие будут отражать оставленными без ответа отдельные позиции. Анкеты, в которых пропущены целые разделы, явно подозрительны. И все же вы не должны отбрасывать их автоматически. Может, например, быть, что пропущенный раздел относится к влиянию супруга на приобретение какой-то серьезной вещи длительного пользования, тогда как респондент в браке не состоит. Несмотря на незаполненный раздел, такой тип полученного ответа определенно полезен.
Тщательное редактирование анкеты иногда показывает, что ответ на какой-то вопрос наверняка неправилен. Возможно, редактор сумеет определить, какой из двух ответов правильный, воспользовавшись другой информацией из той же анкеты.
Кодирование — это «технический прием, с помощью которого данные распределяются по категориям. Посредством кодирования сырые данные превращаются в символы — обычно цифровые, которые можно табулировать и подсчитывать. Однако это преобразование не должно осуществляться автоматически; оно требует здравого суждения кодировщика».
Первый этап кодирования заключается в специфицировании категорий или классов, к которым будут относиться ответы.
Кодирование закрытых вопросов и большинства средств балльной оценки не представляет трудностей, потому что оно устанавливается при конструировании носителя собираемых данных.
Кодирование открытых вопросов может оказаться весьма затруднительным и зачастую много более дорогим, чем кодирование закрытых вопросов. Кодировщику приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы.
Если анкет так много, что необходимо использовать нескольких кодировщиков, дополнительной проблемой может стать возникновение несоответствия в самом кодировании. Чтобы удостовериться в логической последовательности обработки данных, эту работу необходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками.
Второй этап кодирования касается назначения кодовых номеров классов. Например, мужской пол может обозначаться буквой М, а женский — буквой F. Как альтернативный вариант, эти классы могут обозначаться 1 — мужчина и 2 — женщина. Вообще говоря, для обозначения классов лучше использовать цифры, а не буквы. На этой стадии также лучше использовать цифры в том виде, как они зафиксировались в форме сбора данных, а не раскладывать их на более мелкие категории.
Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину. Кроме того, рекомендуется следовать установившимся традициям кодирования данных:
1. Располагать только один символ в каждой колонке.
2. Использовать только числовые коды, а не буквы алфавита или специальные символы вроде @ или пробел,
3. Использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех ее возможных значений.
4. Использовать стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» — цифрой 9, а «не применялось» обозначаться как 0.
5. Кодировать в каждой записи идентификационный номер респондента. Как правило, нет и не будет необходимости идентифицировать в этом номере имя респондента. Этот код просто связывает анкету с кодируемыми данными.
Завершающий этап процесса кодирования состоит в подготовке книги кодов, которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код. Далее в ней указывается, где в компьютерной записи располагается переменная и каким образом эта переменная читается — например, с десятичной точкой или как целое число.

Понравился данный материал?
Не стесняйся, поставь лайк, расскажи о нас своим друзьям, однокурсникам, короче, всем, кому был бы полезнен наш сайт! Тебе ничего не стоит, а нам приятно, что не зря стараемся ;)
Спасибо!