Цифровое литературоведение представляет собой интеграцию цифровых технологий и вычислительных методов в анализ, интерпретацию и представление литературных текстов. Это направление возникло на пересечении гуманитарных наук и информационных технологий и является ключевой составляющей более широкой области исследований, известной как цифровая гуманистика (Digital Humanities). В рамках данной статьи авторы предпринимают попытку теоретического осмысления концепции цифрового литературоведения как новейшей эмпирической и методологической парадигмы. Исследование призвано пролить свет на основные методы, перспективы и ограничения в практике цифрового литературоведения. Описывается историческое развитие концепции, её предпосылки в философии и филологии, дается критическая оценка программной работы Фр. Моретти «Дальнее прочтение» и других ключевых работ в данной области.

Статья анализирует основные подходы к анализу литературного текста с использованием цифровых средств, таких как обработка естественного языка (NLP), эмотивный анализ, сетевой анализ и текстовая визуализация. Подходы, выявленные в результате анализа научной литературы по теме представлены в виде таблицы с указанием конкретных инструментов. Кроме того, в работе рассматриваются перспективы практического применения цифрового литературоведения в контексте казахстанской литературоведческой науки.

Результаты исследования показывают, что цифровые методы позволяют скрытые интертекстуальные и тематические корреляции, способствуют переосмыслению авторства и читательской рецепции, создавая условия для формирования новых теоретических рамок в контексте цифровой гуманистики. Применение этих методов демонстрирует высокую эффективность в исследовании макротенденций в литературе, особенно в области культурной памяти и гендерных структур в казахстанском литературном процессе. Анализ также выявляет ограничения, связанные с недостаточной цифровой инфраструктурой и компетенциями исследователей в Казахстане. Научная значимость работы заключается в предложении путей преодоления этих барьеров и раскрытии потенциала цифровых методов для расширения исследовательского горизонта казахстанского литературоведения, а также в обосновании необходимости интеграции данных подходов в образовательные и научные программы для формирования новой когнитивной парадигмы в литературоведении.

Выводы исследования могут использоваться в преподавании литературоведческих и филологических дисциплин на уровне постдипломного образования, предоставляя студентам и   исследователям новые   методологические подходы и инструменты для изучения литературы.

Ключевые слова: цифровое литературоведение, Digital Humanities, дальнее прочтение, новый формализм, стилометрия.

ОСНОВНЫЕ ПОЛОЖЕНИЯ

В свете цифровой гуманистики (Digital Humanities) возникает новая онтология, которая трансформирует наше понимание и изучение культурных артефактов в целом и литературных текстов в частности. Цифровое литературоведение, интегрируя новейшие технологии и методы анализа данных, формирует новое восприятие текстов и их взаимодействия с читателями, то есть создается новая эмпирическая парадигма, сближающая позитивистскую науку с метафизикой. Это, в свою очередь, ставит перед нами ряд задач, связанных с переосмыслением методов научного познания. Как указывают в своем исследовании A. Amangeldiyev, T. Mustafina, R. Kemerbay, в современной гуманитарной науке «происходит философская рефлексия на реалии и последствия данного процесса, формируется концептуальная основа понимания и оценивания последствий с точки зрения социально- гуманитарного ракурса» [1, 34].

Необходимо также учитывать, что цифровая гуманистика не только преобразует инструменты анализа текстов, но и вызывает существенные изменения в самом понимании текста как объекта исследования. Тексты перестают рассматриваться как статичные и автономные артефакты, вместо этого они начинают восприниматься как динамические структуры, существующие в постоянно меняющемся цифровом пространстве. Этот сдвиг приводит к появлению новой «текстоцентричной экологии», где тексты взаимодействуют с большими массивами данных, сетевыми структурами и даже искусственным интеллектом, что радикально изменяет традиционные представления об авторстве, читательской рецепции и интертекстуальности.

Таким образом, цифровое литературоведение не только расширяет возможности традиционных методов анализа, но и предлагает новые теоретические рамки, позволяющие анализировать тексты как часть более широкой информационной среды. В этом контексте возникает необходимость переосмысления концептов, связанных с понятием текста, где авторство и интерпретация приобретают новые формы.

ВВЕДЕНИЕ

Цифровая гуманистика (Digital Humanities) представляет собой новый этап в изучении культурных артефактов, в том числе литературных текстов, трансформируя традиционные методы анализа. Объектом данного исследования являются цифровые методы анализа литературных текстов, а предметом – их применение в контексте казахстанского литературоведения. Значение данной работы заключается в том, что она открывает новые перспективы для применения методов цифрового литературоведения в казахстанской науке, что, в свою очередь, способствует интеграции казахстанской литературы в мировое научное пространство.

Новая онтология, связанная с цифровой гуманистикой, основывается на нескольких ключевых принципах. Во-первых, тексты рассматриваются как динамические объекты, которые могут быть проанализированы на различных уровнях с использованием вычислительных методов. Это означает, что литературные произведения перестают быть статичными артефактами и начинают восприниматься как постоянно меняющиеся структуры, взаимодействующие с огромным массивом других текстов и данных.

Во-вторых, цифровая гуманистика способствует переосмыслению авторства и интерпретации текстов. Концепция «смерти автора», предложенная Бартом, возводится здесь в абсолют. Тексты обретают новое значение через анализ больших данных, выявление

паттернов и корреляций, которые могли бы остаться незамеченными при традиционном подходе, таким образом акцент смещается с авторского намерения на авторскую интенцию и читательские интерпретации и взаимодействие текстов в цифровом пространстве. Цифровые технологии позволяют собирать и анализировать данные о том, как тексты воспринимаются и интерпретируются различными аудиториями, что, в свою очередь, помогает глубже понять их влияние и значение. Это открывает новые возможности для феноменологического анализа и рецептивной теории.

Наконец, использование инструментов анализа больших данных, сетевого анализа и визуализации  информации  позволяет  создавать   новые  модели гипертекстуальных/интертекстуальных/интермедиальных взаимосвязей.

Таким образом, интеграция цифровых технологий в сферу литературоведческих исследований не только расширяет традиционные методы анализа текстов, но и открывает принципиально новые эвристические возможности для интерпретации литературных произведений. Методы цифрового литературоведения позволяют исследователям оперировать гигантскими массивами данных которые остаются недоступными для традиционного гуманитарного анализа. Эти методологические изменения стимулируют возникновение новых теоретических парадигм и методологических подходов, что требует переосмысления устоявшихся представлений и практик в области литературоведения.

В то же время, в Казахстанском литературоведении данная тема практически не исследована. Отсутствие широкого внедрения цифровых методов и технологий в исследования казахстанских литературоведов обусловлено как объективными, так и субъективными факторами. К числу объективных факторов можно отнести недостаточную развитость цифровой инфраструктуры и ограниченный доступ к международным базам данных и цифровым архивам. Субъективные факторы включают в себя недостаток компетенций и подготовки исследователей в области цифровых технологий, а также консервативность научного сообщества, не всегда готового к восприятию и адаптации новых методологических подходов. Таким образом, научная новизна работы заключается в переосмыслении цифровых методов анализа в контексте национального литературоведения, а также в разработке предложений по их интеграции в учебные программы и научные исследования.

Целью настоящей статьи является предоставление комплексного обзора существующих методологических практик цифрового литературоведения, а также выявление перспективных направлений его дальнейшего развития в рамках Казахстанского литературоведения. Не претендуя на всесторонний охват проблематики в пределах статьи, мы предлагаем общую перспективу на практику цифрового литературоведения. 

МАТЕРИАЛЫ И МЕТОДЫ

Гипотеза исследования основывается на утверждении, что современные методы цифровой гуманитаристики, такие как дальнее прочтение, квантитативный формализм и анализ больших данных, открывают новые возможности для понимания и интерпретации литературных текстов.

В процессе исследования был применен метод диахронического описания научной мысли, а также метод анализа литературы, который позволил изучить наиболее значимые исследования в области цифрового литературоведения. Метод синтеза использовался для систематизации и обобщения полученной информации, что позволило выделить основные направления и тенденции развития данной области. Также был использован сравнительный метод, благодаря которому удалось сопоставить различные подходы и методы цифрового анализа текстов, выявив их преимущества и недостатки.

Комбинация этих методов обеспечила комплексное изучение вопроса и позволила представить всесторонний обзор практик и перспектив цифрового литературоведения. Результаты такого подхода позволили не только выявить ключевые методы и инструменты,

используемые в цифровом литературоведении, но и определить их эффективность и применимость в различных контекстах. Это, в свою очередь, способствует более глубокому пониманию текущих исследований и позволяет сформулировать рекомендации для дальнейших научных изысканий и практического применения цифровых технологий в литературоведении.

Материалами исследования послужила программная работа Франко Моретти в этой области и другие актуальные научные труды. Анализ новейших исследований позволяет выявить современные тенденции и инновации, что обеспечивает полное и точное понимание текущих практик и перспектив цифрового литературоведения. Выбранный подход призван обосновать актуальность научных изысканий в данной области.

По нашим наблюдениям в русле отечественной гуманитарной мысли существует лишь ограниченный ряд работ по общему направлению Digital Humanities (например, работы М. Спабекова и М. Бейсенова (“Methodological challenges in the collection and interpretation of historical data in Kazakhstan”) по цифровизации в исторических науках, Р. Мухамадиевой и У. Кусаиновой (“Digitalization of the Historical and Cultural Heritage of Kazakhstan”) по созданию цифровых культурных архивов, исследования Г. Мадиевой и соавторов («Инновации в изучении поэзии Абая: разработка казахского поэтического подкорпуса») по разработке цифровых корпусов поэзии Абая, а также ряд работ в перспективе социологических исследований центра «Digital Social Research» на базе Восточно-Казахстанского технического университета им. Д. Серикбаева.

РЕЗУЛЬТАТЫ

 История цифрового литературоведения (необходимо отметить отсутствие четкого перевода определения «Digital Humanities» в русскоязычной научной парадигме, функционируют такие термины «цифровые гуманитарные науки», «цифровая гуманистика», «электронные гуманитарные науки») начинается с середины XX века, т.е. с того момента, когда для текстового анализа стали использовать специальные компьютерные программы. Первым значимым проектом стал Index Thomisticus, инициированный Роберто Бусой в 1949 году, который применял вычислительные методы для изучения сочинений Фомы Аквинского. Это положило основу для последующего развития компьютерного анализа текстов.

В 1990-е годы, с ростом интернет-технологий, цифровое литературоведение получило новый импульс благодаря созданию цифровых библиотек, таких как Project Gutenberg и Perseus Digital Library, которые предоставили исследователям доступ к широкому спектру текстов в электронном формате. Это открыло новые возможности для анализа литературы и способствовало развитию дисциплины.

На рубеже XXI века цифровое литературоведение стало более формализованным и институционализированным. Были основаны специализированные научные журналы, такие как «Computers and the Humanities» и «Digital Scholarship in the Humanities», а также международные организации, например, Alliance of Digital Humanities Organizations (ADHO). Эти изменения способствовали укреплению междисциплинарных связей и расширению исследовательских методов.

Однако, первым исследователем, создавшим теоретический научный фрейм для теории цифрового литературоведения стал Франко Моретти. Он разработал концепцию «дальнего прочтения» (distant reading) как радикально новый подход к анализу литературных текстов. В отличие от традиционного «близкого прочтения» (close reading), сосредоточенного на детальном анализе отдельных текстов, «дальнее прочтение» предполагает исследование больших корпусов текстов с использованием статистических и алгоритмических методов.

«Близкое прочтение», в свою очередь, это подход к анализу текста на микроуровне, метод предполагает медленное и тщательное чтение с целью выявления и интерпретации значений, скрытых в тексте, а также понимания авторских намерений и контекстуальных нюансов. Такой подход выделяет некоторые тексты как особенно важные, что способствовует созданию еделенного литературного канона. Последователь Фр. Моретти, М. Уилкенс, отмечает в «близком прочтении» не только методологическую, но и моральную проблему: он считает, что создание канона является актом несправедливости по отношению к тем текстам, которые из него исключены. «То немногое, что мы читаем, абсолютно нерепрезентативно в отношении всего пространства литературы... Каноны ставят нас перед огромной проблемой, которая вытекает из нашего единственно рабочего литературоведческого метода – а именно, из потребности всегда использовать пристальное чтение как единственное средство культурного анализа» [2, 249] – утверждает ученый. О том же пишет и М. Джокерс: «Массивные корпусы текстов открывают нам беспрецедентный доступ к литературным данным и приглашают нас к новому способу собирания фактов и порождения смыслов. Литературовед XXI века больше не может удовлетворяться немногими случайными фактами, собранными из немногочисленных, пусть даже и «репрезентативных» текстов...» [3, 56].

Работа «Дальнее чтение», представляет собой статьи Моретти вышедшие в период с 1994 по 2011 год (опубликованные в виде отдельной книги в 2011). Первоначальная концепция дальнего прочтения была предложена Моретти в начале 2000-х годов и получила свое дальнейшее развитие в его работах, таких как «Graphs, Maps, Trees: Abstract Models for Literary History». В этой работе Моретти представил свою методологию, основанную на использовании графиков и карт для визуализации литературных данных и выявления скрытых паттернов в эволюции литературных жанров и форм. Вместо изучения отдельных текстов этот подход фокусируется на анализе крупных корпусов литературных произведений с использованием вычислительных и статистических методов. Визуализация данных играет важную роль в иллюстрации полученных результатов, помогая исследователям обнаруживать скрытые структуры и связи между произведениями. Моретти утверждает, что такой подход позволяет исследователям видеть литературные процессы в более глобальном масштабе, выявляя макротенденции, которые невозможно обнаружить при анализе отдельных произведений.

Профессор германистики Т. Вейтин и его коллеги определяют следующие уровни «дальности» анализа внутри метода [4, 63]:

Первый тип «дальности» обусловлен ограниченностью языковой компетенции исследователей, что вынуждает их обращаться к работам других специалистов по региональным, национальным или континентальным литературам для изучения мировой литературы.

Второй тип связан с необходимостью «литературоведения второго уровня», которое возникает из-за невозможности охватить все тексты по выбранной теме из-за их большого количества. Это служит обоснованием для использования количественных методов анализа обширных текстовых корпусов.

Третий аспект «дальности» проявляется, когда «дальнее чтение» базируется на качественном исследовании, включающем историко-литературные подходы и систематическое изучение литературной теории. Например, компьютерное моделирование связей между персонажами в драматическом произведении, использующее вторичные источники для получения данных и концепций, которые затем «операционализируются» для анализа. Если процесс «операционализации» успешен, метод позволяет проверять существующие гипотезы, не предлагая нового прочтения исходного текста.

Моретти подчеркивает, что дальнее прочтение не заменяет традиционные методы, а дополняет их, предоставляя новые инструменты для исследования литературной истории. В 2011  году  Моретти  с  коллегами  определили  свой  исследовательский  метод  как «квантитативный формализм» [5, 261], противопоставляя его качественному формализму русского формализма. Необходимо заметить, что истоки «дальнего прочтения» берут начало именно в русле формализма (и его преемника – структурализма), например, в работах Б. Томашевского, В. Проппа, В. Шкловского, М. Гаспарова, и, в особенности Б. Ярхо.

Главная теоретическая работа Б. Ярхо, опубликованная спустя много лет после его смерти, называется «Методология точного литературоведения». В ней литература понимается как структура, система связей между признаками. Литературоведение в таком случае сближается с биологическими дисциплинами, а главный метод исследования – сравнительно- статистический, поддерживаемый, насколько возможно, экспериментом.

В статье М.В. Акимовой «Традиции изучения русского поэтического синтаксиса: Б.И. Ярхо и М.Л. Гаспаров» отмечается, что методы анализа поэтического синтаксиса, разработанные Ярхо, оказали значительное влияние на позднейшие работы Гаспарова:

«Гаспаровский анализ синтаксиса шестистопного ямба Пушкина восходит к той же работе Ярхо. Таким образом, это исследование демонстрирует, что некоторые принципы синтаксического анализа стиха были общими для обоих ученых» [6, 91]. В статье «Towards an Analysis of Russian Inexact Rhyme» Гаспаров использует количественные методы для анализа русского стихосложения: «Quantitative Methods in Russian Metrics: Achievements and Prospects». В работе Шкловского «В защиту социологического метода» подчеркивается важность формального метода в литературоведении: «В защиту социологического метода».

В философской мысли двадцатого века также можно найти предпосылки для развития данного направления. Например, в работе Витгенштейна «Философские исследования» философ пишет следующее: «Присмотрись, нет ли чего-нибудь общего для них всех. Ведь глядя на них, ты не видишь чего-то общего, присущего им всем, но замечаешь подобия, родство, и притом целый ряд таких общих черт... Не думай, а смотри!.. (А результат этого рассмотрения таков: мы видим сложную сеть подобий, накладывающихся друг на друга и переплетающихся друг с другом, сходств в большом и малом...» [7]. Работы философа Реймонда Уильямса, особенно его книга «The Long Revolution», подчеркивают важность системного подхода к литературе и идею, что литературная культура никогда не является единым объектом, а состоит из множества наложенных и изменяющихся формаций. Мишель Фуко в своей работе «Археология знания» подчеркивает важность анализа дискурса и его влияния на формирование знаний и власти. Фуко утверждает: «Дискурс – это не просто язык или речь, но система знаков, которые производят знание и власть» [8]. Эта идея резонирует с методами дальнего прочтения, где анализируются большие объемы текстов для выявления дискурсивных практик. В другой своей классической статье «Что такое автор?», Фуко опирается на размышления Святого Иеронима IV века о гомонимии качества, идеологии, стиля и исторического присутствия автора, и как каждый из этих факторов мог бы исключить произведение из числа приписываемых автору. Этот подход актуален для цифрового подхода к анализу авторства.

Стэнфордская лаборатория по цифровому литературоведению (Stanford Literary Lab), основанная Моретти и его коллегами, стала центром разработки и применения методов дальнего прочтения. Лаборатория занимается различными проектами, которые включают анализ жанровых изменений, исследование литературных сетей и изучение глобальных литературных тенденций. В своих исследованиях лаборатория активно использует инструменты машинного обучения, статистического анализа и визуализации данных. Примером работы лаборатории можно назвать исследование, в котором анализируется использование артиклей в массиве текстов (7000 названий английских романов, написанных в период с 1740 по 1850 годы). Моретти связывает выбор артикля в заглавии произведений с определенной мировоззренческой позицией: неопределенный артикль «a» указывает на неограниченность и открытость в будущее, тогда как определенный артикль «the» сигнализирует об ограничении и ориентирован на прошлое.

Помимо Стэндфорской лаборотории существует ряд исследовательских центров в этой области, например Центр цифровых гуманитарных исследований в Лондонском университетском колледже, Институт цифровых гуманитарных наук в Королевском колледже Лондона, в Кёльнском университете, Принстоне и т.д.

Несмотря на то, что научное сообщество приняло концепцию Моретти благосклонно, в академических кругах существует и критические позиции по отношению к методологии. Приведем основные аргументы критики данной концепции: К. Прендергаст в своей статье «Negotiating World Literature» критикует Моретти за его подход к мировой литературе, утверждая, что «дальнее чтение» слишком обобщает и упрощает сложные литературные тексты и их культурные контексты. Он утверждает, что метод Моретти не учитывает индивидуальные особенности и художественную ценность отдельных произведений, что приводит к потере важной информации и нюансов в литературном анализе [9, 100]. Э. Аптер критикует «дальнее чтение» за его неспособность учитывать вопросы перевода и лингвистические различия. В своей работе «Against World Literature: On the Politics of Untranslatability» она утверждает, что подход Моретти не принимает во внимание сложности перевода и на то, как он влияет на восприятие и интерпретацию литературных произведений [10, 233]. Известный писатель турецкого происхождения Орхан Памук в своей статье «The Naive and the Sentimental Novelist» выражает сомнения по поводу методологии Моретти, считая, что чрезмерное использование количественных данных может привести к утрате чувственной и эмоциональной составляющей литературы, что делает её уникальной [11, 317]. Ф. Джеймисон критикует Моретти за его отказ от традиционного близкого чтения и субъективного анализа. В своей статье «The Geopolitical Aesthetic» он подчеркивает важность глубокого погружения в текст для понимания его скрытых смыслов и контекстов. Однако, на наш взгляд, решением обозначенных критиками проблем является расширение концепций Моретти в рамках вышеназванных подходов. Примиряет сторонников и противников дальнего чтения авторитетное мнение Е.В. Соколовой: «намерения автора концепции «дальнего чтения» Ф. Моретти, отнюдь не призывающего к отказу от «медленного (пристального) чтения» как метода текстового анализа, но предлагающего дополнить последнее «дальним чтением» в качестве фундамента для построения общей картины литературной истории на основе именно «пристального» прочтения, уже осуществленного множеством исследователей» [12].

ОБСУЖДЕНИЕ

 Таким образом, разработки Моретти послужили катализатором исследований в этой области. Однако, заметим, что «дальнее прочтение» не тождественно цифровому литературоведению, а является методологией в данном русле. Рассмотрим другие наиболее значимые существующие методологические подходы в цифровом литературоведении.

Здесь мы можем выделить два основных направления: практика создания цифровых ресурсов и собственно литературоведческая практика. Внутри первого направления существует практика цифровых изданий, в которых создание и использование цифровых литературных текстов позволяет исследователям работать с текстами интерактивно. Такие издания могут включать аннотации, комментарии, гипертекстовые ссылки и мультимедийные элементы, которые облегчают понимание и анализ текстов. Цифровое издание Джеффри Чосера «The Canterbury Tales Project» предоставляет интерактивное цифровое издание «Кентерберийских рассказов». Этот портал содержит открытый доступ к рукописям и изданиям, аннотациям и комментариям. Также доступны интерактивные карты и мультимедийные элементы, такие как аудиофайлы, что делает изучение текста более интерактивным. Кроме того, данная практика включает использование цифровых платформ, которые позволяют читателям и исследователям совместно работать над текстами, оставлять аннотации и комментарии, а также делиться своими мыслями и анализами. Это способствует более глубокому взаимодействию с текстами и обмену знаниями. Примером такой платформы является Hypothesis – портал для социальной аннотации, которая позволяет пользователям аннотировать любые тексты в Интернете. Пользователи могут оставлять публичные или частные аннотации, делиться комментариями и участвовать в обсуждениях.

В этой связи также рассматриваются этические и социальные аспекты цифровизации литературы. Например, исследуются вопросы цензуры, доступности текстов и репрезентации различных культур в цифровых архивах и библиотеках. Это важно для понимания влияния цифровых технологий на литературное наследие и общество в целом. К примеру, Всемирная цифровая библиотека (World Digital Library) занимается созданием цифрового архива, включающего материалы различных культур и языков. Данный проект способствует сохранению мирового культурного наследия и обеспечивает доступ к этим материалам для исследователей и широкой общественности, тем самым поддерживая глобальное культурное разнообразие и способствуя академическим исследованиям.

В контексте направления анализа текстовых данных литературных произведений можно также выделить два основных направления. Первое направление включает в себя методы обработки естественного языка (NLP), машинного обучения в анализе литературных текстов. То есть, можно использовать моделирование тем и эмотивный анализ (такой анализ основан на идее, что слова ассоциируются с определенными чувствами, и что эти ассоциации могут быть количественно оценены) для выявления скрытых паттернов и тем в текстах. Примером может служить работа под названием «Topic Modeling of Eighteenth-Century Literature», в которой исследователи использовали алгоритм LDA (Latent Dirichlet Allocation) для выявления скрытых тем в текстах XVIII века. Анализ помог выявить основные темы и их изменения в литературе того времени. В статье «Sentiment Analysis of Victorian Novels» исследователи использовали методы обработки естественного языка для анализа эмоционального содержания романов викторианской эпохи. Исследование выявило изменения в эмоциональных тонах произведений в зависимости от исторического контекста. В исследовании «Digital Humanities Quarterly» подчеркивается, что методы дальнего прочтения могут использоваться для анализа широкого спектра текстов, выявляя гендерные паттерны и системные предвзятости, которые были бы трудно заметны при традиционном анализе. Широко используются статистические и математические методы для анализа больших текстовых массивов, что включает в себя вычислительную стилистику, анализ частотности слов, распределения тем и других количественных характеристик текста. Наиболее перспективными здесь представляются работы по выявлению авторства и авторской позиции на основе частотной лексики («даже если мы точно не знаем, почему списки частотности слов дают такое хорошее представление о стиле, особенно если дело касается определения авторства текста, позитивные результаты стилометрического метода несомненно остаются вписанными в историю успехов digital humanities» [13]). Один из наиболее известных методов для определения авторства, является метод n-грамм, который включает анализ последовательностей слов или символов. Использование функциональных слов (таких как предлоги, союзы и т.д.) также демонстрирует высокую точность в задачах определения авторства. Успешным примером такого анализа является статья D.H. Sperling, M. Kestemont,

  1. Neyt в котором авторы проверяют, могут ли компьютерные методы анализа авторства корректно идентифицировать Кинга как автора книг Бахмана (литературный псевдоним Кинга) среди современных авторов, похожих на Кинга на стилистическом и сюжетном уровне: Дина Кунца, Питера Страуба и Томаса Харриса.

Существуют также исследования литературных произведений и их авторов через призму сетевого анализа, включая исследование социальных и литературных взаимосвязей между персонажами. Этот подход особенно актуален для изучения пьес, потому что взаимодействия персонажей могут легко быть количественно оценены числом вербальных обменов между персонажами.

Второе направление это визуализация данных, которая также играет важную роль в цифровом литературоведении. С помощью различных инструментов визуализации можно создавать графики, диаграммы и карты, которые помогают визуализировать связи между персонажами, темы и другие аспекты литературных произведений. Это позволяет исследователям и читателям лучше понимать структуру и содержание текстов. Проект

«Mapping the Republic of Letters» визуализировал переписку между европейскими интеллектуалами XVIII века. Используя графические диаграммы, исследователи смогли показать взаимосвязи между ключевыми фигурами эпохи Просвещения. В проекте «Thematic Mapping of the Nineteenth-Century Novel» использовались тепловые карты и графики для визуализации распространения и популярности различных тем в романах XIX века. Это помогло исследователям понять, какие темы были наиболее актуальны в разные периоды.

Отобразим основные подходы (необходимо отметить, что это лишь некоторые из возможных способов анализа) в виде таблицы. 

Таблица 1 – подходы к цифровому анализу литературных текстов

Область применения

Описание

Инструменты

Текстовый анализ

Использование      программ                              для

анализа текста, таких как частотный анализ, поиск ключевых слов и тем.

Voyant Tools, AntConc, NLTK

(Natural     Language                 Toolkit), Python, R.

Семантический анализ

Исследование смысловых структур текста       с                    использованием технологий                                  семантического

анализа.

Word2Vec, Topic Modeling (LDA), Semantic Analysis in Python.

Сетевой анализ

Анализ                                  литературного произведения для выявления связей между персонажами, авторами и

текстами.

Gephi,    Cytoscape,              NetworkX, Palladio.

Геопространственный анализ

Изучение географических аспектов литературных текстов.

GIS    (Geographic          Information

Systems),     Mapbox,                   ArcGIS, QGIS, StoryMap.

Визуализация данных

Создание                                      визуальных представлений данных для лучшего понимания   и   интерпретации

литературных текстов.

Tableau, D3.js, Plotly, Matplotlib, ggplot2.

Эмотивный анализ

Анализ                               эмоционального содержания текста.

Sentiment      Analysis                     Tools,

VADER,      LIWC                   (Linguistic Inquiry and Word Count).

Филогенетический анализ

Применение методов филогенетики для                изучения                эволюции литературных жанров и текстов.

Phylogenetic Analysis Tools, Mesquite, R packages (ape, phangorn).

Анализ стилей и авторства

Исследование стилей и авторства текстов.

JStylo,    Signature              Stylometric Analysis,      Burrows's              Delta,

Computational Stylistics.

Статистический анализ (аналитика больших

данных)

Количественная оценка явлений.

Hadoop, Apache Spark, Google BigQuery, NoSQL Databases.

Необходимо, однако, отметить, что цифровое литературоведение, несмотря на свои значительные успехи, обладает определёнными ограничениями, которые ставят под сомнение его всестороннюю применимость в области литературных исследований. Одним из ключевых аспектов является зависимость от технической инфраструктуры, требующей не только специализированного программного обеспечения, но и мощных вычислительных ресурсов. Эти требования создают барьеры для широкого использования цифровых методов, ограничивая доступ к ним только определённой группой исследователей с необходимыми ресурсами.

Кроме того, алгоритмы, используемые в цифровом литературоведении, нередко оказываются неспособными к полному учёту всех стилистических и семантических нюансов литературного текста. Машинное обучение и обработка больших данных, несмотря на свои преимущества, часто не могут заменить интуитивное понимание и глубокий контекстуальный анализ, присущие традиционному литературоведению. Это приводит к ситуации, когда количественные методы могут не полностью отражать качественные аспекты литературных произведений.

Также следует отметить, что цифровая революция последних лет оказала влияние не только на науку о литературе, но и на сам литературный процесс. На книжном рынке появились тексты, созданные искусственным интеллектом. На данном этапе такие романы не вызывают значительного интереса у литературоведов, так как отсутствие экзистенциальной составляющей снижает их исследовательскую ценность. В этих текстах отсутствует глубокий художественный опыт и контекст, который считается ключевым для анализа литературных произведений.

ЗАКЛЮЧЕНИЕ

Необходимо учитывать, что с развитием искусственного интеллекта возможны появления новых форм художественного творчества, включающих элементы, недоступные человеческому авторству. Это может привести к революционным изменениям в литературе и пересмотру стандартных представлений о литературном произведении и его создании. Таким образом, несмотря на текущие ограничения искусственного интеллекта в создании литературных произведений, его потенциал для будущих инноваций в области литературы требует дальнейшего исследования.

Дальнейшее изучение этого потенциала может привести к новому осмыслению и пониманию литературного процесса, а также к разработке новых теоретических и методологических подходов в литературоведении. Поэтому, несмотря на нынешние ограничения, важно продолжать исследование возможностей и перспектив использования искусственного интеллекта в литературном творчестве, что может оказать существенное влияние на развитие как теории, так и практики литературной науки.

В контексте применения методологических подходов и техник цифрового литературоведения в условиях Казахстанской литературоведческой науки можно обозначить несколько актуальных направлений.

С одной стороны, нам представляются актуальными инициативы по созданию цифровых архивов казахской литературы, представляющая собой не просто акт сохранения культурного наследия, но и его дигитальное переосмысление в глобальном контексте, что позволяет интегрировать казахстанское литературное достояние в мировое научное пространство. Как указывает Р.А. Мухамадаева: «Сохранение уникальных культурно-исторических объектов требует использования новейших технологий. Точные копии и цифровые модели предметов искусства и культуры дадут возможность приобщить большее число казахстанцев и зарубежных исследователей к пониманию истинных ценностей своего народа» [14].

Во-вторых, данный подход может быть актуален для изучения культурной памяти отраженной в литературе Казахстана. Изучение культурной памяти заключается в определении повторяющихся тем с течением времени через различные тексты и медийные каналы, отсылающих к определённым именам и событиям. Вычислительные методы предоставляют возможность систематически отслеживать такие закономерности в большем масштабе.

В-третьих, интеграция гендерных исследований в цифровое литературоведение позволяет выявить системные гендерные паттерны, что может способствовать не только деконструкции традиционных нарративов, но и созданию инклюзивного литературного дискурса.

Также информационные технологии представляют новый инструментарий, который может быть использован при подготовке специалистов в сфере литературоведения, которые помимо навыка накопления интерпретаций отдельных текстов, будут способны рассматривать макропроцессы в литературе. Это, в свою очередь, будет способствовать преодолению разрыва, который зачастую существует между литературой как культурной формой и социальными процессами, происходящими в обществе.

Наконец, многоязычие Казахстана, являющееся важным фактором в литературном контексте, открывает уникальные возможности для исследований в области перевода и

взаимодействия языков. Это позволяет исследовать влияние языковой вариативности на восприятие и интерпретацию литературных произведений, а также выявлять уникальные черты каждого языка, что важно для сохранения и развития культурного многообразия.

Таким образом, цифровое литературоведение в Казахстане представляет собой перспективное направление, способное значительно обогатить как национальное, так и глобальное литературное пространство. Принимая во внимание вышесказанное, на наш взгляд, также имеет актуальность введение дисциплины по цифровому литературоведению в учебные программы студентов-литературоведов отечественных вузов.

ИНФОРМАЦИЯ О ФИНАНСИРОВАНИИ

Данное исследование финансируется Евразийским гуманитарным институтом (Инициативный проект 0124РКИ0183 «Теория и практика цифрового литературоведения: интеграция инструментов искусственного интеллекта»).

СПИСОК ЛИТЕРАТУРЫ

 

  • Амангельдиев А., Мустафина Т., Кемербай Р. Формирование «цифровой философии» как нового направления в философии. – URL: https://bulletin-philospolit.kaznu.kz/index.php/1- pol/article/view/1543 (дата обращения: 14.07.2024).
  • Wilkens Canons, close reading, and the evolution of method // Debates in the Digital Humanities

/ Ed. by Gold M.K. Minneapolis: Univ. of Minneapolis Press, 2011. – P. 249-258.

  • Jockers M. Macroanalysis: Digital methods and literary – Urbana: Univ. of Illinois Press, 2013. – 192 p.
  • Weitin Reading at Scale: A Digital Analysis of German Novellas from the 19th Century // Mixing Methods: Practical Insights from the Humanities in the Digital Age / Ed. by Birgit Schneider et al. Bielefeld: Bielefeld University Press, 2023. – P. 63-78. DOI: 10.14361/9783839469132.
  • Моретти Ф. Дальнее чтение / Пер. с англ. Вдовина А., Собчука О., Шели А.; Науч. ред. перевода Кушнарева И. – М.: Изд-во Института Гайдара, 2016. – 352 с.
  • Акимова М.В. Традиции изучения русского поэтического синтаксиса: Б.И. Ярхо и М.Л. Гаспаров // Труды Института русского языка им. В.В. Виноградова. – – №4(14). – С. 89- 113.
  • Wittgenstein                   Philosophical                   Investigations.                                   – URL: https://static1.squarespace.com/static/54889e73e4b0a2c1f9891289/t/564b61a4e4b04eca59c4 d232/1447780772744/Ludwig.Wittgenstein.-.Philosophical.Investigations.pdf                   (дата                             обращения: 10.07.2024).
  • Фуко М.                 Археология                 знания.                   –                        URL: https://monoskop.org/images/a/ae/Фуко_Мишель_Археология_знания.pdf (дата обращения: 09.2024).
  • Prendergast Negotiating World Literature // New Left Review. – 2001. – №8. – P. 100-121.
  • Apter Against World Literature: On the Politics of Untranslatability. – Verso, 2013.
  • Pamuk The Naive and the Sentimental Novelist. – Harvard University Press, 2010.
  • Соколова В. Истолковать и/или исчислить: о возможности комбинированного метода на стыке герменевтики и digital humanities. – URL: https://cyberleninka.ru/article/n/istolkovat-i-ili- ischislit-o-vozmozhnosti-kombinirovannogo-metoda-na-styke-germenevtiki-i-digital-humanities (дата обращения: 04.07.2024).
  • Jannidis F. Der Autor ganz nah – Autorstil in Stilistik und Stilometrie // Theorien und Praktiken der Autorschaft, Eds. Matthias Schaffrick, Marcus Willand. – Berlin: De Gruyter, 2014. – P. 169-
  • Мухамадеева Р.М., Мухамадеева И.А. Внедрение цифровизации в процесс сохранения национального потенциала казахской культуры // Научный электронный журнал «Матрица научного познания», 2022. – С. 88.

    Материал поступил в редакцию журнала 27.07.2024