i
Полезная информация
Свернуть
17.11.2024
ruensvdefrptesitzharnl

Чем дальше в лес, тем больше дров...

Чем дальше в лес, тем больше дров...

Чем дальше в лес, тем больше дров.

Пытаюсь научить программу разбирать художественный текст. Пока худо-бедно дошли до выявления главных героев и взаимодействий между ними (но не всех).

Притом, что имена героев на самом деле совершенно не важны. Какая разница, как звали Евгения Онегина, главное, что он убил Ленского. То есть, мне нужно, чтобы программа выявила суть. Сюжет. Занесла в какой-нибудь реестр сюжетов, что такое в литературе уже было, и такое было, а вот если соединить это с этим, будет новый сюжет.

А я даже героев выявить не могу. Ну, хорошо: Онегин, Ленский. А как программа поймет сочетания – слуга Онегина, девушка Ленского? А если у Ленского по тексту будет до фигища этих девушек, и про каждую будут говорить – новая девушка Ленского? А потом где-то упоминание, что они расстались, и опять – Новая девушка Ленского... И как программа поймет, что это разные девушки?

В «Онегине» такого не было, а вот «Внутри кита пустота» Замировской – есть такое.

Там же вскрылись еще проблемы. Оказывается, человек нормально может читать тексты со смысловыми ошибками, даже если пропущены важные слова или фраза двусмысленная. Но программа-то не может. А почему? Как у человека получается домысливать?

Вот примеры:

.

Даша рассказывает про отношения с Невицким и про Майю.

Майя досталась Даше в роли приданого, она была приложением к Невицкому

(потом дофигища текста)

Даша спросила, как дела у Невицкого и этой. Ну, этой. Вы понимаете.

Здесь программа не поймет, что во втором предложении речь идет про Майю.

.

Невицкий женился, все случилось быстро, познакомились там-то, он сразу понял, вот она, та самая.

 Невицкий испугался, что она привяжется к Майе больше, чем к нему.

Здесь программа не поймет во втором предложении, кто она. Потому что в первом предложении нет указания, кто она. Но мы-то понимаем...

16:46
420
0
Aagira Aagira 3 года назад #
А разве здесь смысловая ошибка?
0
Мария Фомальгаут Мария Фомальгаут 3 года назад #
Ну да, тут не ошибка. Тут непонятно, как человек понимает, о ком идет речь, а программа не поймет. Мы держим в памяти: Невицкий+Майя, а программа нет. Ей не было указания держать в памяти такую связку. Или что, теперь из-за одного прецедента велеть программе каждый раз сохранять в памяти, кто с кем тесно связан? Холмс+МориартиВатсон, Степлтон+Берил?

0
Aagira Aagira 3 года назад #
Вообще, поскольку читать я научилась раньше, чем понимать многие тонкости текстов и предложений, а также слова из «взрослого» словаря, то в детстве при чтении книжек (особенно рассчитанных чуть на более старший возраст, или таких, где автор предполагал, что родитель вместе с ребенком читает и все непонятное объяснит), такие казусы у меня возникали почти постоянно (один, вот, вспомнился, могу рассказать). Так что, твою программу я хорошо понимаю и ей сочувствую!
0
Мария Фомальгаут Мария Фомальгаут 3 года назад #
Объяснять. Тут вопрос, как объяснять, насколько глубоко разжевывать. Вот сейчас думаю, как искать цели героев. Сделать таблицу с подробным перечислением — я хочу, он хочет, он сказал — я хочу, мне нужно, ему нужно, я мечтаю…
Но сюда же и действия героя в будущем времени: я поеду в Лондон, я убью британскую таможню Мориарти, Колобок-Колобок, я тебя съем.
0
Мария Фомальгаут Мария Фомальгаут 3 года назад #
Расскажи казус!
0
Aagira Aagira 3 года назад #
Расскажу.
Была у меня в детстве (и сейчас где-то есть) вот эта книга:



На картинке — именно то, конкретное издание. Довольно интересное: половина книги в переводе, а если перевернуть, то вторая половина — оригинальный текст. Но английского я в то время не знала, а вот в переводе зачитывалась, и чуть ли не наизусть знала эту историю. Кстати, отмечу, что не любила диснеевский мультик за то, что там весь сюжет упрощен и перекроен до безобразия. В повести все сложнее и намного интереснее.

Ну вот, начну с первой части казуса, вызванного переводом имен. Вообще, имена, конечно, не переводятся, но здесь перевод был бы оправдан по такой причине. В оригинале у собак их хозяев (или, выражаясь языком повести — «питомцев») зовут мистер и миссис Darling. И когда читаешь оригинал, сразу понятно, почему Darling: люди обращаются так друг к другу (дорогой/дорогая), а на собачий взгляд это как бы их имена. Переводчик эту фишку, видимо, просек… и обозвал супружескую чету: Милоу. Я понимаю, что было бы правильно: мистер Милый, миссис Милая. Но переводчик зачем-то пришпилил иностранный суффикс к русскому слову, а когда говорящее имя переводится таким образом, то оно теряет свой смысл, и спрашивается, а зачем его переводить было? Оставили бы как Дарлинг и все дела. Короче, этот недоперевод был для меня пустым (я считала, что это было английской фамилией), пока не прочла оригинал и не поняла, что там намек на то, что это не их настоящее имя.

Но это еще полбеды. Сама фамилия, переведенная с потерей не только смысла, но и утратившая склонение по падежам (как говорю: адекватнее было бы Милый/Милая), стала причиной собственно казуса. До сих пор помню ту фразу: «Поначалу миссис Милоу немного шокировали брюки, которые носила… [работница]»

Я ребенком не особенно понимала слово «шокировать». И когда прочла в первый раз эту фразу, то стала в ступор, много раз ее перечитывала и не могла в ней разобраться. А взрослые не понимали, в свою очередь, что у меня с ней не так. Просто в быту с таким словом не каждый день сталкиваешься, да и в литературе оно не так часто встречается. Суть в том, что когда не понимаешь слова, то, по крайней мере, тебе будут ясны его отношения с остальными членами предложения. Но! Здесь, в конкретно этом предложении, действие осуществляют брюки, которые шокируют героиню. А в непонятной фразе порядок воспринимается, как прямой: подлежащее, сказуемое. То есть, миссис с несклоняемой фамилией совершила действие «шокировать», и шокировала брюки. Понятно, что по смыслу это невозможно, но если смысл недоступен, то грамматически вопринималось так. И мой разум просто пришел к выводу, что там опечатка: или пропущен мистер с той же фамилией, который шокировал брюки вместе с ней. Или надо «шокировала» вместо «шокировали». Ну вот. Не знаю, лет восемь мне было, но помню тот момент до сих пор. Когда меня сама фраза вот так шокировала. ch_lol
0
Мария Фомальгаут Мария Фомальгаут 3 года назад #
Тут вообще вон чего нашла: textovod.com/idea
Выводит основную мысль текста.
Интересно, как он это делает…

Программа считывает ваш текст.
Потом сервис анализирует ключевые слова и словосочетания, а также, их синонимы. Ключевые слова повторяются в тексте много раз. Это основополагающий момент, т. к. «ключевики» несут главную мысль любого текста.
Далее алгоритм изучает подзаголовки и абзацы. Разделяя текст на абзацы, автор создаёт микротемы. Таким образом дифференцируются смысловые, важные для него части, раскрывающие тему.
Затем происходит исследование логической цепочки. Программа прослеживает развитие логики повествования на протяжении всего текста. Данная операция очень важна для выявления основного посыла текста.
Если вместе с текстом вы ввели и его название — это упрощает работу сервиса. Ведь название текста — это, вероятно, часть главной мысли всего текста. Хотя заголовки бывают метафорическими, парадоксальными и ассоциативными.
0
Aagira Aagira 3 года назад #
Закинула туда самую понятную из своих миниатюр: dabudetsolnce.ru/articles/44-necenzurnoe-slovo.html

Выдало:
Определить и записать основную мысль текста
Главредактор яростно, изо всех сил, бил газетой, свернутой в трубку, в разные точки стола, как будто пытался избавиться от бегающих тараканов.


Ну-ну, оказывается, идея текста в том, что редактор лупил газетой по столу? Вот если бы последнюю фразу поставило, я бы еще поняла…

Попробовала другой рассказ, весь посвященный одной главной мысли, но ни один читатель ее так и не сформулировал: dabudetsolnce.ru/articles/223-intellektual.html

Тут программа справилась лучше:

Определить и записать основную мысль текста

Виртуальный помощник должен был делать рутинную работу выявлять баги в написанных Ботовым программах, чистить файловую систему, лечить ошибки компьютера. Идея Ботова была в том, чтобы сделать его ученым в лаборатории, поборником правды, порядка и справедливости; разумом, тянущимся к познанию и спасению виртуальной среды, которую принимал за реальный мир. Котов был не просто высокоинтеллектуальным существом он был как живой!



Но знаешь что тут заинтересовало? Когда я выложила этот рассказ в свое время на «Ф»-сайте (году в 2013 было), именно этот абзац оказался помещен редактором в поле краткого описания. Вот четко от начала и до конца этот. Я так понимаю, что там не парились, и юзали подобные сервисы, которые, видимо, существовали уже тогда. Наверное, и не изменились с тех пор. ch_lol
0
Мария Фомальгаут Мария Фомальгаут 3 года назад #
Похоже, фигня все это программа эта…
0
Aagira Aagira 3 года назад #
Похоже, но проверь сама.
  В ненадолго наступившей тишине вдруг раздался чей-то недовольный голос: – И все стоят...
20:40
Мысли вслух. Пока в работе над генератором текстов возникают только неразрешимые вопросы.   ...
Давно уже перестали мелькать редкие всполохи береговых костров. Судно отплывало все дальше и дальше,...
Раздалось вежливое покашливание и Барт с неудовольствием взглянул на рыжеволосого крестьянина, смуще...
20:15

Все представленные на сайте материалы принадлежат их авторам.

За содержание материалов администрация ответственности не несет.