Экономика » Теория » Применение контент-анализа в экономических науках: обзор текущего состояния дел и перспектив

Применение контент-анализа в экономических науках: обзор текущего состояния дел и перспектив

Статьи - Теория

А. Н. Олейник


Неоклассическую экономическую теорию, образующую мейстрим дисциплины, обычно характеризуют рядом теоретических постулатов. К ним относят аксиомы устойчивости предпочтений, рационального выбора и равновесного состояния рынка (Эггертссон, 2001. С. 19). Мейнстрим можно определить и на методологическом уровне. О принадлежности к мейнстриму свидетельствует использование исследователем количественных данных, методов регрессионного анализа и математического моделирования.

Качественные данные и методы, пригодные для их обработки, находятся на периферии экономических исследований. Проанализировать 2 млн текстов гипотетически возможно, но сложнее, чем осуществить аналогичное число регрессий. Однако даже если это удается сделать, вероятность опубликовать результаты в ведущих экономических журналах невелика. Методы работы с качественными данными, прежде всего контент-анализ, не вписываются в неоклассический канон, а потому неизвестны разделяющим его экономистам и отторгаются ими. В настоящей статье описаны текущая ситуация с использованием экономистами качественных данных и контент-анализа как метода их обработки, а также перспективы ее изменения.

В качестве первого шага разграничим три понятия: данные, информация и знание. «Данные» представляют собой зафиксированные факты (Witten et al., 2017. Р. xxiii). Факты могут документироваться как в форме текста (качественные данные1), так и в цифровом формате (количественные данные). Первоначальное документирование фактов в одном формате не исключает их последующего перевода в другой (например, текста в ряд чисел).

«Информация появляется в результате анализа обработанных данных человеком, этот анализ придает данным смысл и обеспечивает им потребительские качества» (Черняк, 2011). Исходные данные лишены структуры и организации, а информация имеет внутреннюю структуру. Она в этом смысле «организована», что позволяет сконцентрировать внимание на паттернах, то есть на ключевых тенденциях в задокументированных фактах, и не тратить ограниченные когнитивные ресурсы на детали.

«Знание» подразумевает наличие системы, пригодной для интерпретации и осмысления выявленных паттернов. Это может быть как повседневная, так и научная теория, объясняющая паттерны. Неоклассическая теория представляет собой частный случай системы, разработанной для выявления и осмысления паттернов в количественных данных о состоянии экономики. При этом экономические факты могут быть выражены и осмыслены и в качественной форме, через текст. В данной статье предлагается ответ на следующий вопрос: можно ли способствовать популяризации качественных данных посредством использования контент-анализа для преобразования качественных данных в экономическую информацию и экономическое знание?

Ценовая и текстовая информация

В экономических науках, если пока исключить из рассмотрения неортодоксальные подходы, ключевым носителем информации выступает цена. Вся совокупность рыночных данных через цену получает количественное выражение. Выраженная количественно информация, в свою очередь, позволяет получить знание на основе математического моделирования и, говоря более широко, математической систематизации.

Первичные данные об экономических трансакциях разнородны и обширны. Они касаются таких разнопорядковых фактов, как личная репутация продавца или количество выставленных на продажу товаров. Столь разнородные данные тем не менее имеют общий знаменатель — цену. «Рыночн[ые] принцип[ы] интегриру[ют] неуловимые изменения в поведении индивидов в единую конкурентную цену» (Тевено, 1997. С. 76). Таким образом, рыночная цена выступает количественным выражением экономической информации, включая и репутацию продавца — в той мере, в которой соответствующие данные экономически значимы2.

Перевод данных в количественное измерение и их агрегирование посредством механизмов рыночного ценообразования предопределили распространение математического моделирования в экономических науках. «Формалистская» революция, основным итогом которой стало приобретение математическим моделированием статуса методологического стандарта для экономистов, свершилась в первой половине XX в. Если еще в 1930-х годах экономисты весьма осторожно использовали математические символы в своих статьях, то к концу 1950-х им стало сложно опубликовать работы, написанные без использования солидного математического аппарата (Lawson, 2013; Hodgson, 2011; Copeland, 1951).

Сравнение эволюции экономических наук с социологией, ситуация в которой в XIX в. была весьма схожа, помогает лучше понять влияние рыночного ценообразования на вопросы экономической методологии. Исходные данные в социологии тоже разнородны и обширны. Однако здесь задача перевода данных в информацию, а тем более количественную, не имеет «естественного» и «универсального» решения, подобного рыночному ценообразованию. Поэтому социологи вынуждены решать задачу измерения в каждом отдельном случае. «Измерение — это процедура, с помощью которой измеряемый объект сравнивается с некоторым эталоном [шкалой] и получает числовое выражение в определенном масштабе или шкале» (Ядов, 1995. С. 81). В отличие от цены, эталонов в социологии множество, а статус каждого из них постоянно оспаривается. Степень математизации в социологии, соответственно, ниже, чем в экономических науках. Часть значимых для социологов данных остается качественными, что требует использования иных, нежели математическое моделирование, методов исследования.

Впрочем, не все экономисты признают рыночное ценообразование в качестве «естественной» и «универсальной» процедуры конвертации данных в информацию. Классические и неоклассические экономисты, а также кейнсианцы считают, что цена содержит всю значимую информацию, но расходятся во взглядах на источник первичных данных. 

Сторонники неортодоксальных подходов отказываются сводить значимую информацию к цене. Именно у «диссидентов» среди экономистов есть мотивация к работе с качественными данными и продолжению методологических дебатов.

С точки зрения классической экономической теории А. Смита, Д. Рикардо и Дж. С. Милля, имеющие значение факты касаются затрат и организации (разделения) труда. Цена товара или услуги рассматривается сторонниками этой теории как количественное выражение затрат труда, необходимых для их производства. «Действительная цена всякого предмета, то есть то, что каждый предмет действительно стоит тому, кто хочет приобрести его, есть труд и усилия, нужные для приобретения этого предмета» (Смит, 2016. С. 70).

Сторонники неоклассической теории видят значимые факты не в затратах труда, производстве, а в процессе потребления. Хотя первичные данные теперь касаются субъективной полезности, они по-прежнему имеют ценовое, а значит, количественное выражение. «Ценность благ основана на отношении благ к нашим потребностям, а не на их сущности» (Менгер, 2005. С. 131).

И классические, и неоклассические экономисты работают с данными на микроуровне. Кейнсианцы оперируют с данными на макроуровне — объемом занятости и выраженной в деньгах суммой стоимостей (Кейнс, 1993. С. 254). Цена зависит именно от денег и занятости, которые имеют количественное выражение. В случае денег дело усложняется тем, что «они являются связующим звеном между настоящим и будущем» (Кейнс, 1993. С. 451). Субъективные ожидания участников рынка относительно будущего имеют качественную составляющую — периодически сменяющиеся оптимистическое и пессимистическое настроение (Кейнс, 1993. С. 343). Однако признание важности качественных данных не сопровождается в кейнсианстве разработкой специальных методов работы с ними.

К неортодоксальным относят экономические теории, сторонники которых отказываются видеть в математическом моделировании универсальный и единственно верный метод исследования. Список таких теорий включает марксизм, оригинальный (старый) институционализм, посткейнсианство, феминистскую экономику, социоэкономику, экономику соглашений (Lawson, 2006. Р. 484). Одна из причин, по которым неортодоксальные экономисты критически относятся к математическому моделированию, — признание недостаточности количественных данных вообще и цены в частности для анализа трансакций на рынке.

По мере удаления от ситуации совершенной конкуренции цена перестает содержать всю значимую информацию. Цену требуется дополнить такими качественными данными, как ожидания в отношении действий контрагентов и интерпретация их намерений. Признание «неполноты информации» в условиях несовершенной конкуренции обусловливает интерес к когнитивной составляющей в принятии экономических решений: какие именно факты учитывались и как происходило их осмысление (Тамбовцев, 2020; Тевено, 2001. С. 106).

Ввиду своей разнородности неортодоксальные экономические теории не образуют монолитного знания. Речь идет о попытках систематизации информации, в том числе неценовой, предпринятых представителями различных теорий независимо друг от друга. Хотя ввиду признания, что «цена есть денежное название овеществленного в товаре труда» (Маркс, 1985. С. 111), марксизм близок к классической экономической теории, интерес К. Маркса и его последователей к условиям труда обусловливает их восприимчивость к качественным данным в дополнение к количественным. Цена не отражает всех аспектов капиталистической эксплуатации, что обусловило попытки Маркса собирать дополнительные качественные данные для документирования ее деталей с помощью социологических опросов («Анкеты для рабочих» 1880 г.)

Экономика соглашений Л. Болтански и Л. Тевено (Boltanski, Thevenot, 1991) позволяет рассмотреть вопрос о качественных и количественных данных и носителях информации наиболее комплексным образом. Так, наряду с ценой в качестве носителей информации рассматриваются технические стандарты и нормативы (индустриальное соглашение), закон (гражданское соглашение), обычаи и традиции (традиционное соглашение), слухи (соглашение об общественном мнении) и т.д. (Олейник, 2000. С. 50). Несложно заметить, что и закон, и обычаи, и слухи производны от качественных данных. Отсюда потребность в методах исследования, которые позволяли бы работать с качественными данными. Примечательно, что ключевые положения экономики соглашений были сформулированы с использованием контент-анализа ряда классических работ, выбранных в качестве «репрезентативных» для каждого соглашения.

Контент-анализ текстовой информации

Контент-анализ (КА) представляет собой метод агрегирования, обработки и анализа качественных данных. В той мере, в какой качественные данные используются экономистами наряду с количественными данными, КА имеет потенциал дополнить математическое моделирование в списке методов исследования в экономических науках. Однако этот потенциал пока остается большей частью нереализованным.

Контент-анализ как метод исследования

Контент-анализ возник после Второй мировой войны на волне интереса к исследованию использовавшихся в ее ходе стратегий пропаганды. Его родоначальником считается Г. Лассуэл (Krippendorff, 2004. Р. 19—20). В СССР КА стал известен в 1970-е годы. Первыми стали его использовать участники Сибирского социологического семинара в Новосибирске (Алексеев, 1970) и семинара Б. Грушина в Москве (Таршис, 2013) — социологи, философы, исследователи коммуникаций и СМИ, специалисты по информатике, психологи и лингвисты.

КА можно определить как «совокупность методов для систематического кодирования и анализа качественных данных и тестирования гипотез в отношении текстов» (Bernard, 2013. Р. 536 — 537).

Текст рассматривается как совокупность задокументированных фактов. Из совокупности разрозненных фактов (данных) требуется извлечь информацию, значимую для ответа на вопрос исследования. «Задача состоит в том, чтобы выяснить связь текста с некоторой „внетекстовой реальностью", так или иначе продуцирующей этот текст» (Здравомыслов, 1973. С. 15). Текст в необработанном виде содержит качественные данные, а подвергнутый КА текст превращается в носитель информации.

Восприятие текста как носителя информации о «внетекстовой реальности» (условиях труда, интересных марксистам, или превалирующих среди участников рынка настроениях, значимых для посткейнсианцев) требует пояснений. Здесь возможны два варианта: реальность создателя, автора (отражаемая при создании текста) и реальность интерпретатора, читателя (задаваемая условиями прочтения). Оба подхода к определению «внетекстовой реальности» имеют право на существование.

Во-первых, речь может идти о выявлении отражаемой при создании текста реальности, то есть о поиске заложенного в текст содержания. «Текст — это предмет, вещь. Каждый предмет обладает содержанием» (Таршис, 2013. С. 54). КА в таком контексте ориентирован на понимание и имеет герменевтическую направленность.

Во-вторых, КА может быть направлен на выявление смыслов, возникающих при прочтении текста. Согласно этому подходу, «тексты лишены каких-либо объективных, то есть независимых от читателя, качеств» (Krippendorff, 2004. Р. 22). Основной задачей КА становится интерпретация. Вариантов интерпретации множество — по количеству контекстов прочтения. «Интерпретация есть перманентное состояние текста, поскольку он всегда вписан в какую-то ситуацию» (Аверьянов, 2009. С. 21).

Сопоставить приоритет понимания и интерпретации в КА и показать множественность вариантов интерпретации поможет следующий пример. В качестве иллюстрации русской экономической мысли рассмотрим отрывок из 31-го раздела «Домостроя» XVI в. (цит. по: Платонов, 1995. С. 39), пока игнорируя разного рода подчеркивания:

«Если же кто, не оценив себя и не рассчитав добра своего, ремесла и прибыли, или государева жалованья и добытка законного, начнет, на людей глядя, жить не по доходу, занимая или неправедно приобретая, то честь его обернется великим бесчестием со стыдом и позором, а в лихое время никто ему не поможет: от безрассудства своего пострадает, да и от Бога грех, а от людей насмешка. Надобно каждому человеку избегать тщеславия и похвал и наживы неправдой, жить по силе своей и возможности, и по расчету, и по средствам, добытым праведно».

Неизвестные авторы «Домостроя» старались при его создании донести идею отношения «к труду как добродетели, как к нравственному деянию» (Платонов, 1995. С. 7). Если КА помог выявить эту идею, то задача понимания достигнута. Напротив, возможные варианты интерпретации не ограничиваются данной идеей. Современные экономисты отметили бы идеи, которые остаются актуальными и сегодня: рациональность, кредит3 и доверие. Они выделены («закодированы») соответствующим образом: подчеркиванием, курсивом и полужирным шрифтом. При этом не исключено, что один экономист в качестве читателя «Домостроя» выделит рациональность и кредит, а другой, симпатизирующий неортодоксальным теориям, — доверие.

Помимо различий в точке отсчета, КА характеризуется и множеством форм: КА бывает качественный, количественный и с использованием смешанных методов (Олейник, 2009). Качественный КА предполагает ручное кодирование на основе субъективных оценок исследователя, который читает текст и отмечает различные фрагменты, иллюстрирующие основные паттерны («коды») (Файбусович, 1973. С. 49). Разновидностью качественного КА является кодирование с использованием языка оригинала, in vivo coding. К примеру, вместо «рациональность», можно заимствовать для названия кода язык оригинала, то есть «жить по силе своей и возможности, и по расчету, и по средствам, добытым праведно». Кодирование с использованием языка оригинала применяется при построении обоснованных теорий (восхождении к теории) — grounded theorizing. Первоначально отмечаются с использованием языка оригинала все значимые фрагменты, затем они группируются в коды, названия которых уже отличаются от языка оригинала. Хотя и на «входе», и на «выходе» качественного КА имеем текст, он в результате анализа превращается из совокупности «данных» в «информацию». Закодированные фрагменты содержат информацию, полезную для ответа на вопрос исследования, а остальное выносится за скобки. Уместна аналогия с использованием закладок и подчеркиванием при чтении книги: именно выделенные фрагменты содержат наиболее значимую информацию.

В количественном КА акцент делается на преобразовании текста в цифровой формат. Это достигается как вручную — при небольшом объеме текстовых данных, так и компьютером с использованием специализированного программного обеспечения. Постоянное и активное участие исследователя в последнем случае не обязательно. Расчет относительных частотностей слов, а также их совместная встречаемость (как часто конкретные слова и выражения встречаются в тексте рядом) позволяют выявить и интерпретировать значимые для вопроса исследования паттерны. При этом исходные качественные данные преобразуются на «выходе» в количественные. Задача исследователя: различать и интерпретировать значимые и незначимые паттерны и получить на этой основе количественную информацию.

Возвращаясь к фрагменту из «Домостроя», расчет частотности слов позволяет выделить следующие слова:4 свое* — 3 раза, расч*, неправ*, добыт*, люде* и жить — по 2 раза. Идею расчетливости в хозяйственной жизни, таким образом, можно выявить и посредством количественного КА.

В КА с использованием смешанных методов ручное кодирование дополняется расчетом частотности слов и выражений. В отличие от количественного КА, принимаются во внимание не все слова и выражения, а только репрезентативные для уже закодированных вручную фрагментов. Список репрезентативных слов и выражений образует своеобразный словарь, создаваемый для решения конкретной исследовательской задачи. В рассмотренном выше примере выражения «по расчету», «по средствам» могут быть включены в раздел «рациональность» словаря, что позволит автоматически присваивать данный код любому содержащему их фрагменту.

КА с использованием смешанных методов применяется, к примеру, в исследованиях тональности текста (sentiment analysis). Создано большое количество словарей для описания эмоций: WordNet-Affect, SentiWordNet, General Inquirer, SenticNet, SentiSense и другие (Khan et al., 2017; Ravi, Ravi, 2015). С их помощью можно определить общую эмоциональную тональность текста, не полагаясь на субъективные оценки от его прочтения. Используются специализированные словари и для выявления доминирующих мотивов автора текста (Шалак, 2004. С. 116 —121)5. В этом случае словари создаются на базе разработанного психологами тематического апперцептивного теста (Леонтьев, 2000).

Одно из преимуществ КА количественного и с использованием смешанных методов состоит в том, что их применение позволяет работать в том числе и с большими данными. Выражение «обучение с учителем», в роли которого выступает создающий словарь исследователь (Черняк, 2011), отражает специфику масштабирования на большие качественные данные КА с использованием смешанных методов. Так, КА публикаций в СМИ или в интернете позволяет вернуться к решению задачи выявления господствующих на рынке настроений, оптимистических или пессимистических, поставленной еще Кейнсом. Вручную необходимый объем текстовых данных не обработать, а вот с помощью компьютеризированного КА это возможно. Частота упоминаний некоторых тем в больших данных, а также превалирующая тональность публикаций, как выясняется, коррелируют с динамикой ключевых макроэкономических показателей (Thorsrud, 2016; Bollen et al., 2011).

Вне зависимости от формы, КА относится к «строгим» методам исследования. «Строгое исследование всегда включает... некоторую процедуру, то есть определенную сознательно контролируемую и четко фиксированную последовательность действий с эмпирическими объектами или их заместителями — знаками» (Алексеев, 1973. С. 22). Даже в случае ручного кодирования исследователь должен выполнить ряд процедур, позволяющих повысить надежность и достоверность получаемых результатов. Ручное кодирование по определению субъективно, особенно если во главу угла ставится не понимание, а интерпретация. Для оценки надежности и достоверности качественного КА одного текста его независимо кодируют несколько исследователей, а затем рассчитывают коэффициенты согласия между ними: а Криппендорффа, я Скотта, к Коэна и др. (Krippendorff, 2004. Р. 211—256). Эти коэффициенты позволяют учитывать фактор случайности при достижении согласия между кодировщиками. Только если коэффициенты согласия превышают критические значения, результаты кодирования признают надежными и пригодными для публикации.

Ситуация с использованием контент-анализа в экономических науках

Несмотря на потребность в работе с качественными данными, которую испытывают часть экономистов, прежде всего неортодоксальной ориентации, она пока остается неудовлетворенной. Причем в российском случае знание и использование экономистами КА значительно ниже уровня, который достигнут на Западе. В этом нетрудно убедиться, проведя КА метаданных статей, проиндексированных в базах данных Web of Science, которая содержит преимущественно англоязычные публикации, и eLibrary, которая содержит публикации преимущественно на русском языке. В качестве ключевых слов при поиске использовались «content-analysis» и «контент-анализ» соответственно.

Журналы в области прикладной экономики с большей готовностью печатают англоязычные статьи, подготовленные с использованием КА, чем экономические периодические издания с другим профилем. Среди лидеров по числу опубликованных работ, в которых используется КА, такие журналы, как Energy Policy (26 статей), Forest Policy and Economics (25), Journal of Consumer Affairs (17) и Value in Health (14 статей). Отметим интерес к использованию КА со стороны неортодоксальных экономистов. Например, чешские экономические социологи использовали КА для исследования режима регулирования частного акционерного и венчурного капитала в этой стране (Skalicka Dusatkova et al., 2017), а институциональные экономисты из США подвергли КА материалы годовой отчетности ряда госпиталей в штате Массачусетс (Arendt, Bigelow, 2000).

Хотя количество работ, написанных экономистами с использованием КА, на Западе непрерывно возрастает6, их доля в общем числе проиндексированных в Web of Science публикаций остается небольшой — менее 0,1% (табл. 1). Чтобы выяснить, можно это объяснить трудностями с публикацией работ, в которых используется «нестандартная» методология, или слабым знанием КА экономистами, были проанализированы метаданные препринтов (working papers) и научных докладов на английском языке7. Поиск осуществлялся в двух базах данных —  Social Science Research Network (SSRN) и Research Papers in Economics (RePEc). Как следует из их названий, в первую включены не достигшие стадии журнальной публикации работы в области общественных наук в целом, а во вторую — только в области экономических наук. Общая доля работ, в которых использован КА, в SSRN выше, чем в Web of Science и eLibrary, за счет индексирования в двух последних базах данных естественно-научных статей. По сравнению с общественными науками, КА в естественных науках используется для подготовки обзоров литературы. Если ограничиться сравнением англоязычных статей и препринтов, то доля статей, в которых используется КА, выше, чем соответствующая доля препринтов. Поэтому недостаточное знакомство экономистов с КА следует признать основной причиной ограниченного использования этого метода.

Таблица 1

Сравнительная частота упоминания контент-анализа в метаданных статей, проиндексированных в Web of Science и eLibrary, по состоянию на октябрь 2020 г.

Показатель

Web of

Science

SSRN

RePEc

eLibrary

Всего проиндексировано статей

74792557

950733

-

35074626

контент-анализ упоминается в названии, аннотации, ключевых словах, раз

62035

2299

-

9282

В %

0,077

0,242

-

0,026

В том числе проиндексировано статей в предметной области «Экономика. Экономические науки» (eLibrary) «Economics» (SSRN) «Business & economics» (Web of Science)

1758982

528341

993597б

3953517

контент-анализ упоминается в названии, аннотации, ключевых словах, раз

5773

878

655

3523

в %

0,31

0,166

0,066

0,09

В том числе в 15 ведущих экономических журналаха

21932

-

-

39080

контент-анализ упоминается в названии, аннотации, ключевых словах, раз

49

-

-

55

в %

0,22

-

-

0,14

Примечание. а Определенных на основе импакт-фактора за 2019 г. и величины рейтинга ИБСЛ за 2018 г.; б Только препринты.

Источник: составлено автором.

Если сравнивать русско- и англоязычные статьи экономистов, то по всем трем параметрам сравнения наблюдается отставание в 2 — 3 раза. Тенденция к росту частоты упоминания КА в метаданных русскоязычных статей, опубликованных в 15 ведущих экономических журналах (3 в 2013 г., 5 в 2016 г., 7 в 2019 г.), слишком слаба, чтобы переломить выявленную закономерность. Поиск в полном тексте опубликованных экономистами статей не изменил общей картины. Так как Web of Science не имеет такой опции, результаты для eLibrary сравнивались с данными Google Scholar. КА встречается в полном тексте 0,14% всех проиндексированных в eLibrary статей и в 0,65% статей, проиндексированных в Google Scholar.

Помимо относительной малочисленности написанных с использованием КА статей, в русскоязычной литературе превалирует нестрогое использование данного метода. Ни одна из опубликованных в 15 ведущих русскоязычных журналах статей не содержит четкого определения КА, его формы и использованной процедуры. В ряде случаев авторы упоминают КА в аннотации, не возвращаясь к обсуждению методологии в тексте статьи. Поэтому действительный уровень «грамотности» российских экономистов в области профессиональной работы с качественными данными даже ниже, чем указано в таблице 1.

Несмотря на это, можно выделить ряд исследовательских задач, для решения которых российские экономисты применяли КА.

  1. КА используется экономистами для подготовки обзоров литературы (Ковалев, 2020; Ковалев, 2019; Цветков и др., 2017; Кузнецова, Тимофеева, 2016; Демьяненко и др., 2011). Тенденция к расширению списков цитируемой литературы затрудняет несистемную обработку источников.
  2. Российские экономисты применяют КА для анализа дискурса. С его помощью исследуется эволюция ключевых понятий и варианты их применения в литературе (Каз, 2013; Демьяненко и др., 2011).
  3. С помощью КА экономисты обрабатывают результаты качественных интервью (Ефимов, 2016; Yefimov, 2003).
  4. Популярен среди российских экономистов КА различных документов: законодательства (Волынский и др., 2018; Цветков и др., 2017), государственных программ (Гильтман и др., 2019; Дегтерев и др., 2018), отчетов компаний (Кельчевская и др., 2017; Кузнецова, Тимофеева, 2016; Шалак, 2004. С. 171) и патентов (Стрельцова, 2014).
  5. Экономисты используют КА для получения переменных, пригодных для корреляционного и регрессионного анализа (Кельчевская и др., 2017; Мельникова, 2016). Так, частотность некоторых слов и выражений в публикациях СМИ выступает хорошим прогностическим параметром для ряда макроэкономичских показателей (Коноплев, 2020; Яковлева, 2010). При решении таких задач предпочтение отдается КА с использованием смешанных методов, что обусловливает совместимость даже с неоклассическими подходами.

Обзор использования КА российскими экономистами указывает на преобладание его качественных форм (табл. 2). Это наблюдение вполне согласуется с отмеченной ранее тенденцией к нестрогому использованию КА в русскоязычной экономической литературе. Качественные формы КА легче понять на интуитивном уровне, так как они производны от базовых навыков чтения и работы с текстом.

Таблица 2

Формы КА и примеры их использования российскими экономистами

КА

Вход

Степень формализации процедуры

Выход

Примеры

использования

Качественный

Качественные данные (текст)

Слабо формализованная

Качественная информация (текст)

Подготовка обзоров литературы; анализ дискурса; анализ транскриптов интервью и официальных документов

Количественный

Высокоформа-лизованная с возможностью автоматизации («без учителя»)

Количественная информация (частотность кодов или слов, их совместная встречаемость и т. д.)


С использованием смешанных методов

Формализованная,

«с учителем»

Получение переменных, пригодных для корреляционного и регрессионного анализа

Источник: составлено автором.

Обращает на себя внимание и отсутствие примеров использования количественного КА в журнальных публикациях на русском языке. Ближе всего к данной форме КА следует признать одну статью (Коноплев, 2020) и один препринт (Яковлева, 2010). В обоих случаях, однако, количественный КА — выявление биграмм и триграммавтором статьи и создание списка тем с помощью тематического моделирования (topic modelling) автором препринта — дополнялся использованием словарей для анализа эмоциональной окрашенности текста. Данный результат может свидетельствовать как о слабом знакомстве российских экономистов с наиболее «строгой» формой КА, так и об ограниченной применимости КА без «учителя» в экономических исследованиях. Получившее признание у лингвистов и социологов тематическое моделирование (DiMaggio et al., 2013) позволяет решать ряд описательных задач, а экономисты, особенно близкие к мейнстриму, ориентированы на анализ.

Вместо заключения: перспективы контент-анализа в экономических науках

КА представляется одним из наиболее недооцененных методов анализа в экономических науках. В той мере, в какой экономисты работают с качественными данными, КА помогает их преобразовать сначала в информацию, а затем в знание. Хотя представители мейнстрима редко обращаются к качественным данным, даже они иногда используют в математическом моделировании переменные, полученные в результате преобразования качественных данных. Неортодоксальные экономисты работают с качественными данными значительно активнее, не рассматривая цену в качестве единственного носителя значимой информации.

Однако и те и другие агрегируют, обрабатывают и анализируют качественные данные во многом несистемно. Знание принципов КА, а тем более их «строгое» использование — редкость среди экономистов, особенно российских. Количество англоязычных публикаций экономистов, в которых упоминается КА, в 2 — 3 раза превышает соответствующий показатель публикаций на русском языке. Поэтому задача-минимум видится в сокращении такого отставания.

Задача-максимум: признать за качественными данными такой же статус в экономических науках, какой имеют количественные данные. Это позволит рассматривать КА в качестве необходимого элемента методологического набора экономиста вне зависимости от его ориентации. Отсутствие банков качественных данных, доступных для вторичного анализа, является одним из препятствий на этом пути. Существует множество банков количественных данных, среди наиболее известных — World Development Indicators, созданный и поддерживаемый Всемирным банком. Получение с их помощью переменных для математического моделирования не требует затрат. Напротив, собранные исследователями качественные данные хранятся в различных местах. Поиск и извлечение данных для вторичного анализа сегодня невозможны. Онлайн-платформа для КА ThinkMate.org — первый шаг в данном направлении. Она позволяет в режиме свободного доступа проводить КА текстов, а если создатель качественных данных выбирает соответствующую опцию, то вторично их использовать. Кроме того, КА в режиме онлайн потенциально позволяет работать с большими данными. Именно с развитием онлайн-платформ для КА появляется шанс для пересмотра отношения экономистов к данному методу исследования.


1 Качественные данные принимают и другие формы, например изображений, но их обсуждение остается за рамками настоящей статьи.

2 А значимы они в той мере, в какой издержки измерения качества товара или услуги велики (North, 1981. Р. 39).

3 Особенно в контексте высокого уровня закредитованности современных домохозяйств.

4 * обозначает любую букву или их сочетание.

5 В этом случае «внетекстовая реальность» понимается как «реальность создателя».

6 Так, в 2017 и 2018 гг. экономисты впервые опубликовали больше работ с использованием КА, чем социологи.

7 Автор благодарен одному из рецензентов за соответствующую подсказку.

8 Устойчивых последовательностей из 2 и 3 слов соответственно.


Список литературы / References

Аверьянов Л. Я. (2009). Контент-анализ. Учебное пособие. М.: Кнорус. [Averyanov L. Y. (2009). Content analysis. A textbook. Moscow: Knorus. (In Russian).]

Алексеев A. H. (ред.) (1970). Проблемы контент-анализа в социологии: Материалы Сибирского социологического семинара. Новосибирск: Институт истории, филологии и философии СО АН СССР. [Alexeev А. N. (ed.) (1970). Issues of content-analysis in sociology. Novosibirsk: Institute of History, Philology and Philosophy of the Siberian Branch of the USSR Academy of Sciences. (In Russian).]

Алексеев A. H. (1973). Контент-анализ в социологии и точки соприкосновения с другими отраслями знания Здравомыслов А. Г. (отв. ред.). Методологические и методические проблемы контент-анализа (тезисы докладов рабочего совещания социологов). Вып. 1. М.; Л.: Институт социологических исследований. С. И — 18. [Alexeev А. N. (1973). Content analysis in sociology and its relevance to other disciplines. In: A. G. Zdravomyslov (ed.). Methodological and organizational issues in content analysis (Proceedings of the meeting of sociologists), Iss. 1. Moscow and Leningrad: Institute for Sociological Studies, pp. 11 — 18. (In Russian).]

Волынский А. И., Круглова M. С., Рожков П. В., Рубинштейн A. A. (2018). Законодательные механизмы в РФ как инструмент институционального дизайна: на материалах анализа количественных данных базы Lawstream.ru Вопросы теоретической экономики. № 2. С. 91 — 100. [Volynsky A. I., Kruglova М. S., Rozhkov Р. V., Rubinshtein А. А. (2018). Legal norms as an instrument of institutional design: A study using the quantitative databank Lawstream.ru. Voprosy Teoreticheskoi Ekonomiki, No. 2, pp. 91 — 100. (In Russian).]

Гильтман M. А., Обухович H. В., Токарева О. E. (2019). Активная и пассивная политика на российском рынке труда: централизация или регионализация? Вопросы экономики. № 6. С. 79 — 98. [Giltman М. A., Obukhovich N. V., Tokareva О. Е. (2019). Active and passive labour market policies on the Russian labour market: Centralization or regionalization? Voprosy Ekonomiki, No. 6, pp. 79 — 98. (In Russian).]

Дегтерев Д., Василюк И., Баум В. (2018). Параметры многовекторности внешней политики стран СНГ: прикладной анализ. Мировая экономика и международные отношения. Т. 62, № 1. С. 63—75. [Degterev D., Vasilyuk L, Baum V. (2018). Multiplexity parameters of the CIS foreign policy: Applied analysis. Mirovaya Ekonomika i Mezhdunarodnye Otnosheniya, Vol. 62, No. 1, pp. 63—75. (In Russian).]

Демьяненко A. H., Изотов Д. А., Демьяненко H. А., Украинский В. H. (2011). «Кластеры», «ТПК», «полюса роста» в российских научных журналах. Пространственная экономика. № 1. С. 93 — 106. [Demyanenko A. N., Izotov D. А., Demyanenko N. A., Ukrainsky V. N. (2011). “Clusters”, “ТРС”, “growth poles” in Russia’s science journals. Prostranstvennaya Ekonomika, No. 1, pp. 93 — 106. (In Russian).]

Здравомыслов А. Г. (1973). Предисловие Здравомыслов А. Г. (отв. ред.). Методологические и методические проблемы контент-анализа (тезисы докладов рабочего совещания социологов). Вып. 1. М.; Л.: Институт социологических исследований. С. 8 — 17. [Zdravomyslov A. G. Introduction. In: A. G. Zdravomyslov (ed.). Methodological and organizational issues in content analysis (Proceedings of the meeting of sociologists), Iss. 1. Moscow and Leningrad: Institute for Sociological Studies, pp. 8—17. (In Russian).]

Ефимов В. M. (2016). Экономическая наука под вопросом: иные методология, история и исследовательские практики. М.: ИНФРА-М. [Yefimov V. М. (2016). Economic sciences questioned: Alternative methodology, history and research practices. Moscow: Infra-M. (In Russian).]

Каз E. M. (2013). Качественные и количественные методы в исследовании мотивации персонала. Вестник Томского государственного университета. Экономика. № 2. С. 97—101. [Kaz Е. М. (2013). Qualitative and quantitative methods for studying motivation of personnel. Vestnik Tomskogo Gosudarstvennogo Universiteta. Ekonomika, No. 2, pp. 97—101. (In Russian).]

Кейнс Дж. M. (1993). Общая теория занятости, процента и денег. Кейнс Дж. М. Избранные произведения. М.: Экономика. С. 224 — 518. [Keynes J. М. (1993). The general theory of employment, interest, and money. In: J. M. Keynes. Selected works. Moscow: Ekonomika, pp. 224 — 518. (In Russian).]

Кельчевская H. P., Черненко И. M., Попова Е. В. (2017). Влияние корпоративной социальной ответственности на инвестиционную привлекательность российских компаний. Экономика региона. Т. 13, Вып. 1. С. 157—169. [ICelchevskaya N. R., Chernenko I. М., Popova Е. V. (2017). The impact of corporate social responsibility on the investment attractiveness of the Russian companies. Economy of Region, Vol. 13, No. 1, pp. 157—169. (In Russian).]

Ковалев A. B. (2019). Дебаты Кейнса и Хайека: переосмысление в свете современной макроэкономики. Вестник Санкт-Петербургского университета. Экономика. Т. 35, Вып. 2. С. 283 — 308. [Kovalev А. V. (2019). Keynes vs. Hayek debates: Rethinking in the light of contemporary macroeconomics. St Petersburg University Journal of Economic Studies, Vol. 35, No. 2, pp. 283 — 308. (In Russian).]

Ковалев A. B. (2020). К оценке теоретической эволюции Менгера, или Сюжет о «четырех Менгерах». Журнал Новой экономической ассоциации. № 1. С. 44 — 63. [Kovalev А. V. (2020). On the evaluation of Menger’s theoretical evolution, or A story on “four Mengers”. Journal of the New Economic Assotiation, No. 1, pp. 44 — 63. (In Russian).]

Коноплев Д. Э. (2020). Асимметрия информационных волн в экономическом мышлении: опыт финансовых кризисов. Вопросы экономики. № 1. С. 111 — 126. [Konoplev D. Е. (2020). The asymmetry of information waves in economic thinking: The experience of financial crises. Voprosy Ekonomiki, No. 1, pp. 111 — 126. (In Russian).]

Кузнецова H. В., Тимофеева А. Ю. (2016). Проблемы и инструментарий выявления угроз кадровой безопасности региона. Экономика региона. Т. 12, Вып. 4. С. 1123 — 1134. [Kuznetsova N. V., Timofeeva A. Y. (2016). Challenges to regional labor force security and tools for discovering them. Economy of Region, Vol. 12, No. 4, pp. 1123 — 1134. (In Russian).]

Леонтьев Д. A. (2000). Тематический апперцептивный тест. 2-е изд. М.: Смысл. [Leontiev D. А. (2000). Thematic apperception test. Moscow: Smysl. (In Russian).] Маркс К. (1985). Капитал. T. 1. М.: Издательство политической литературы. [Marx К. (1985). Capital. Vol. 1. Moscow: Izdatelstvo Politicheskoy Literatury. (In Russian).]

Мельникова A. C. (2016). Современные методологические подходы к организации мониторинга трудовой миграции и ее влияние на социально-экономические и демографические параметры территориального развития. Фундаментальные исследования. № 10. С. 627—631. [Melnikova A. S. (2016). Modern methodologies for monitoring labor migration and its impact on socio-economic and demographic dimensions of regional development. Fund ament alnye Issledovaniya, No. 10, pp. 627—631. (In Russian).]

Менгер К. (2005). Основания политической экономии Менгер К. Избранные работы. М.: Территория будущего. [Menger К. (2005). Principles of economics. Moscow: Territoriia Budushchego. (In Russian).]

Олейник A. H. (2000). Институциональная экономика: Учебное пособие. М.: Инфра-М. [Oleinik А. N. (2000). Institutional economics: A textbook. Moscow: Infra-M. (In Russian).]

Олейник A. H. (2009). Триангуляция в контент-анализе: вопросы методологии и эмпирическая проверка Социологические исследования. № 2. С. 65—79. [Oleinik А. N. (2009). Triangulation in content analysis. Sotsiologicheskie Issledovaniya, No. 2, pp. 65—79. (In Russian).]

Платонов О. А. (сост.) (1995). Экономика русской цивилизации. М.: Родник. [Platonov О. A. (ed.) (1995). Economy of Russian civilization. Moscow: Rodnik. (In Russian).]

Смит A. (2016). Исследование о природе и причинах богатства народов. 2-е изд. М.: Эксмо. [Smith А. (2016). An inquiry into the nature and causes of the wealth of nations. Moscow: Eksmo. (In Russian).]

Стрельцова E. (2014). Патентная активность в сфере биотехнологий Форсайт. Т. 8, № 1. С. 52 — 65. [Streltsova Е. (2014). A survey of patents in biotechnology. Foresight, Vol. 8, No. 1, pp. 52 — 65. (In Russian).]

Тамбовцев В. Л. (2020). Нарративный анализ в экономической теории как восхождение к сложности. Вопросы экономики. № 4. С. 5 — 30. [Tambovtsev V. L. (2020). Narrative analysis in economics as climbing complexity. Voprosy Ekonomiki, No. 4, pp. 5 — 30. (In Russian).]

Таршис E. Я. (2013). Контент-анализ: принципы методологии. Программы исследования. Москва: URSS; Либроком. [Tarshis Е. Y. (2013). Content analysis: Methodological principles. Moscow: URSS; Librokom. (In Russian). ]

Тевено Л. (1997). Множественность способов координации: равновесие и рациональность в сложном мире. Вопросы экономики. № 10. С. 69 — 84. [Thevenot L. (1997). Plurality of forms of coordination: Equilibrium and rationality in a complex world. Voprosy Ekonomiki, No. 10, pp. 69 — 84. (In Russian).]

Тевено Л. (2001). Рациональность или социальные нормы: преодоленное противоречие? Экономическая социология. № 2. С. 88 — 122. [Thevenot L. (2001). Rationality or social norms: A contradiction that has been overcome? Economicheskaya Sociologiya, No. 2, pp. 88 — 122. (In Russian).]

Файбусович В. Л. (1973). Из опыта сопоставления данных контент-анализа и опроса Здравомыслов А. Г. (отв. ред.). Методологические и методические проблемы контент-анализа (тезисы докладов рабочего совещания социологов). Вып. 2. М.; Л.: Институт социологических исследований. С. 46 — 51. [Faibusovych V. L. (1973). A comparison of the data collected with the help of a content analysis and a survey. In: A. G. Zdravomyslov (ed.). Methodological and organizational issues in content analysis (Proceedings of the meeting of sociologists), Iss. 2. Moscow and Leningrad: Institute for Sociological Studies, pp. 46 — 51. (In Russian).]

Цветков В. А., Шутьков А. А., Дудин M. И., Лясников И. B. (2017). Совершенствование системы налогового администрирования в России. Финансы: теория и практика. Т. 21, № 6. С. 34 — 49. [Tsvetkov V. A., Shutkov A. A., Dudin М. N., Lyasnikov N. V. (2017). Improvement of the tax administration system in Russia. Finance: Theory and Practice, Vol. 21, No. 6, pp. 34 — 49. (In Russian).]

Шалак В. И. (2004). Современный контент-анализ. Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. М.: Омега-Л. [Shalak V. I. (2004). Contemporary content analysis: Applications to political science, psychology, sociology, culturology, economic sciences and advertising. Moscow: Omega-L. (In Russian).]

Черняк Л. С. (2011). Большие данные — новая теория и практика. Открытые системы. СУБД. № 10. С. 18—25. [Chernyak L. S. (2011). Big data — new theory and practice. Otkrytye Sistemy. SUBD, No. 10, pp. 18—25. (In Russian).]

Эггертссон T. (2001). Экономическое поведение и институты. М.: Дело. [Eggertsson Т. (2001). Economic behavior and institutions. Moscow: Delo. (In Russian).]

Ядов В. A. (1995). Социологическое исследование: методология, программа, методы. Самара: Самарский университет. [Yadov V. А. (1995). Sociological research: Methodology, program and methods. Samara: Samarskij Universitet. (In Russian).]

Яковлева К. (2010). Оценка экономической активности на основе текстового анализа. Серия докладов об экономических исследованиях. М.: Банк России. [Yakovleva К. (2010). Assessment of economic activity with the help of textual analysis. Series of reports on economic research. Moscow: Bank of Russia. (In Russian).]

Arendt M., Bigelow B. (2000). Presenting structural innovation in an institutional environment: Hospitals’ use of impression management. Administrative Science Quarterly, Vol. 45, No. 3, pp. 494 — 522.

Bernard R. H. (2013). Social research methods: Qualitative and quantitative approaches, 2nd ed. Thousand Oaks, CA: Sage.

Bollen J., Mao H., Zeng X. (2011). Twitter mood predicts the stock market. Journal of Computational Science, Vol. 2, No. 1, pp. 1 — 8.

Boltanski L., Thevenot L. (1991). De la justification: Les economies de la grandeur. Paris: Gallimard.

Copeland M. (1951). Institutional economics and model analysis. American Economic Review, Vol. 41, No. 2, pp. 56 — 65.

DiMaggio P., Nag M., Blei D. (2013). Exploiting affinities between topic modelling and the sociological perspective on culture: Application to newspaper coverage of US government arts funding. Poetics, Vol. 41, No. 6, pp. 570 — 606.

Hodgson G. M. (2011). The eclipse of the uncertainty concept in mainstream economics. Journal of Economic Issues, Vol. 45, No. 1, pp. 159 — 176.

Khan F. H., Qamar U., Bashir S. (2017). A semi-supervised approach to sentiment analysis using revised sentiment strength based on SentiWordNet. Knowledge and Information Systems, Vol. 51, No. 3, pp. 851 — 872.

Krippendorff K. (2004). Content analysis: An introduction to its methodology, 2nd ed. Thousand Oaks, CA: Sage.

Lawson T. (2006). The nature of heterodox economics. Cambridge Journal of Economics, Vol. 30, No. 4, pp. 483—505.

Lawson T. (2013). What is this “school” called neoclassical economics? Cambridge Journal of Economics, Vol. 37, No. 5, pp. 947—983.

North D. C. (1981). Structure and change in economic history. New York: Norton.

Ravi K., Ravi V. (2015). A survey on opinion mining and sentiment analysis: Tasks, approaches and applications. Knowledge-Based Systems, Vol. 89, pp. 14 — 46.

Skalicka Dusatkova M., Zinecker M., Meluzin T. (2017). Institutional determinants of private equity market in Czech Republic. Economics and Sociology, Vol. 10, No. 4, pp. 83-98.

Thorsrud A. (2016). Words are the new numbers: A newsy coincident index of business cycles. Norges Bank Working Paper, No. 21 2016.

Yefimov V. (2003). Economic institutionnelle des transformations agraires en Russie. Paris: L’Harmattan.

Witten I. H., Frank E., Hall M. A., Pal C. J. (2017). Data mining: Practical machine learning tools and techniques, 4th ed. Cambridge, MA: Morgan Kaufmann.