Чем дальше в лес, тем больше дров...
Чем дальше в лес, тем больше дров.
Пытаюсь научить программу разбирать художественный текст. Пока худо-бедно дошли до выявления главных героев и взаимодействий между ними (но не всех).
Притом, что имена героев на самом деле совершенно не важны. Какая разница, как звали Евгения Онегина, главное, что он убил Ленского. То есть, мне нужно, чтобы программа выявила суть. Сюжет. Занесла в какой-нибудь реестр сюжетов, что такое в литературе уже было, и такое было, а вот если соединить это с этим, будет новый сюжет.
А я даже героев выявить не могу. Ну, хорошо: Онегин, Ленский. А как программа поймет сочетания – слуга Онегина, девушка Ленского? А если у Ленского по тексту будет до фигища этих девушек, и про каждую будут говорить – новая девушка Ленского? А потом где-то упоминание, что они расстались, и опять – Новая девушка Ленского... И как программа поймет, что это разные девушки?
В «Онегине» такого не было, а вот «Внутри кита пустота» Замировской – есть такое.
Там же вскрылись еще проблемы. Оказывается, человек нормально может читать тексты со смысловыми ошибками, даже если пропущены важные слова или фраза двусмысленная. Но программа-то не может. А почему? Как у человека получается домысливать?
Вот примеры:
.
Даша рассказывает про отношения с Невицким и про Майю.
Майя досталась Даше в роли приданого, она была приложением к Невицкому
(потом дофигища текста)
Даша спросила, как дела у Невицкого и этой. Ну, этой. Вы понимаете.
Здесь программа не поймет, что во втором предложении речь идет про Майю.
.
Невицкий женился, все случилось быстро, познакомились там-то, он сразу понял, вот она, та самая.
Невицкий испугался, что она привяжется к Майе больше, чем к нему.
Здесь программа не поймет во втором предложении, кто она. Потому что в первом предложении нет указания, кто она. Но мы-то понимаем...
Aagira 3 года назад #
Мария Фомальгаут 3 года назад #
МориартиВатсон, Степлтон+Берил?Aagira 3 года назад #
Мария Фомальгаут 3 года назад #
Но сюда же и действия героя в будущем времени: я поеду в Лондон, я убью
британскую таможнюМориарти, Колобок-Колобок, я тебя съем.Мария Фомальгаут 3 года назад #
Aagira 3 года назад #
Была у меня в детстве (и сейчас где-то есть) вот эта книга:
На картинке — именно то, конкретное издание. Довольно интересное: половина книги в переводе, а если перевернуть, то вторая половина — оригинальный текст. Но английского я в то время не знала, а вот в переводе зачитывалась, и чуть ли не наизусть знала эту историю. Кстати, отмечу, что не любила диснеевский мультик за то, что там весь сюжет упрощен и перекроен до безобразия. В повести все сложнее и намного интереснее.
Ну вот, начну с первой части казуса, вызванного переводом имен. Вообще, имена, конечно, не переводятся, но здесь перевод был бы оправдан по такой причине. В оригинале у собак их хозяев (или, выражаясь языком повести — «питомцев») зовут мистер и миссис Darling. И когда читаешь оригинал, сразу понятно, почему Darling: люди обращаются так друг к другу (дорогой/дорогая), а на собачий взгляд это как бы их имена. Переводчик эту фишку, видимо, просек… и обозвал супружескую чету: Милоу. Я понимаю, что было бы правильно: мистер Милый, миссис Милая. Но переводчик зачем-то пришпилил иностранный суффикс к русскому слову, а когда говорящее имя переводится таким образом, то оно теряет свой смысл, и спрашивается, а зачем его переводить было? Оставили бы как Дарлинг и все дела. Короче, этот недоперевод был для меня пустым (я считала, что это было английской фамилией), пока не прочла оригинал и не поняла, что там намек на то, что это не их настоящее имя.
Но это еще полбеды. Сама фамилия, переведенная с потерей не только смысла, но и утратившая склонение по падежам (как говорю: адекватнее было бы Милый/Милая), стала причиной собственно казуса. До сих пор помню ту фразу: «Поначалу миссис Милоу немного шокировали брюки, которые носила… [работница]»
Я ребенком не особенно понимала слово «шокировать». И когда прочла в первый раз эту фразу, то стала в ступор, много раз ее перечитывала и не могла в ней разобраться. А взрослые не понимали, в свою очередь, что у меня с ней не так. Просто в быту с таким словом не каждый день сталкиваешься, да и в литературе оно не так часто встречается. Суть в том, что когда не понимаешь слова, то, по крайней мере, тебе будут ясны его отношения с остальными членами предложения. Но! Здесь, в конкретно этом предложении, действие осуществляют брюки, которые шокируют героиню. А в непонятной фразе порядок воспринимается, как прямой: подлежащее, сказуемое. То есть, миссис с несклоняемой фамилией совершила действие «шокировать», и шокировала брюки. Понятно, что по смыслу это невозможно, но если смысл недоступен, то грамматически вопринималось так. И мой разум просто пришел к выводу, что там опечатка: или пропущен мистер с той же фамилией, который шокировал брюки вместе с ней. Или надо «шокировала» вместо «шокировали». Ну вот. Не знаю, лет восемь мне было, но помню тот момент до сих пор. Когда меня сама фраза вот так шокировала.
Мария Фомальгаут 3 года назад #
Выводит основную мысль текста.
Интересно, как он это делает…
Программа считывает ваш текст.
Потом сервис анализирует ключевые слова и словосочетания, а также, их синонимы. Ключевые слова повторяются в тексте много раз. Это основополагающий момент, т. к. «ключевики» несут главную мысль любого текста.
Далее алгоритм изучает подзаголовки и абзацы. Разделяя текст на абзацы, автор создаёт микротемы. Таким образом дифференцируются смысловые, важные для него части, раскрывающие тему.
Затем происходит исследование логической цепочки. Программа прослеживает развитие логики повествования на протяжении всего текста. Данная операция очень важна для выявления основного посыла текста.
Если вместе с текстом вы ввели и его название — это упрощает работу сервиса. Ведь название текста — это, вероятно, часть главной мысли всего текста. Хотя заголовки бывают метафорическими, парадоксальными и ассоциативными.
Aagira 3 года назад #
Выдало:
Ну-ну, оказывается, идея текста в том, что редактор лупил газетой по столу? Вот если бы последнюю фразу поставило, я бы еще поняла…
Попробовала другой рассказ, весь посвященный одной главной мысли, но ни один читатель ее так и не сформулировал: dabudetsolnce.ru/articles/223-intellektual.html
Тут программа справилась лучше:
Но знаешь что тут заинтересовало? Когда я выложила этот рассказ в свое время на «Ф»-сайте (году в 2013 было), именно этот абзац оказался помещен редактором в поле краткого описания. Вот четко от начала и до конца этот. Я так понимаю, что там не парились, и юзали подобные сервисы, которые, видимо, существовали уже тогда. Наверное, и не изменились с тех пор.
Мария Фомальгаут 3 года назад #
Aagira 3 года назад #