В лучших традициях Задорнова...
По Задорнову.
Планы на год.
Несмотря на ошибки в чертежах и неправильную сборку запустить аэродинамическую трубу.
Если останусь жива...
Это я про генератор текстов.
Хочу его собрать. С самого начала.
А начало – это личность автора.
А как определяется личность автора?
Хватаюсь за первое понятное, - темы, на которые он пишет.
А как выявить тему?
Предполагаю – по определенным словам.
То бишь. Если встречаются слова – Париж, кафе, круассаны, платье, духи, флирт, поцелуй – это что-то милое, романтическое.
Если слова – лес, чаща, роща, мороз, ружье, пыжи, патроны, тетерев, - это тема охоты.
Было желание скачать 1000 самых распространенных существительных, сравнивать с текстами разных авторов. Например, взять текст автора, выбрать все существительные, убрать эти 1000 общих существительных, они все равно в каждом тексте – и посмотреть, какие встречаются другие существительные.
Решила попробовать свою гипотезу на произведениях неокей Марии Фомальгаут. И началось.
Был взят рассказ Угу-у-у. И что? Я не могу выбросить оттуда слово «дом», потому что идет противопоставление уютного дома и страшного внешнего мира ночью на улице. Уж никак не могу выбросить слово глаза – противопоставляются маленькие глазки юных голубят и жуткие глазища совенка. Не могу выбросить слово крылья – вся суть, что говорится вроде как про людей, а они крыльями машут. Слово небо не могу выбросить – ночное небо, на нем луна. И луну не могу выбросить, вокруг неё тоже вся соль текста.
А вот например, в рассказе Конан Дойля «Берилловая диадема» слово дом легко можно убрать, это слово неважно для текста.
Итак, получается два варианта:
Сравнить авторский текст с тысячей самых частых слов, убрать из авторского текста самые частые слова.
Из оставшихся слов выбрать самые часто встречающиеся – это и есть тема текста, его особенность.
Или второй вариант:
Сравнить авторский текст с тысячей слов, выбрать, какие слова из тысячи частых слов автор НЕ использует, и какие слова автор использует помимо тысячи слов.
Это что-то даст при генерации текста под какого-то автора. Хотя бы на уровне – НЕ используй эти слова, обязательно используй эти.
Но при разборе текста некоей Марии Фомальгаут все оказалось намного сложнее.
Например, дело не в том, что в тексте есть небо, а небо – звездное, темное, звездами утыканное, и не просто луна, а луна из-за горизонта выплывает, над лесом поднимается, большая, круглая, дивно пахнущая сыром, уу-ух…
И дело не в крыльях, а в крылышках – деточки, моем крылышки, и за стол.
Крылышки. Солнышки. Глазищи. И даже не так – оладьи, запеченные из солнышка. И совенок за столом просит кусочек луны. Важно, что не просто – а за столом, подтекст, что они и солнышко, и луну едят...
Ведь не написано прямым текстом - едят луну.
Написано - едят оладушки из солнышка. И совенок просит кусочек луны.
И как программа вьедет, что тут луна за каким-то чертом съедобная стала? Никак не въедет. Потому что, например, сидят люди, обедают, один просит - а дайте мне газету - ну ясен же пень, что не жрать он её собирается. А у Марии Фомальгаут в книгах герой после обеда попросит газету и ею закусит на десерт.
Легко.
В этом Мария Фомальгаут. В сложнейшем контексте. А не в употребляемых словах.
Не дети, а детишечки, не город, а городок, не человек – песочный человек, открывает большим ключом луну.
Вот и думаю, есть ли смысл выбирать слова, которые использует автор, хотя бы для начала такое сделать. Или вообще не поможет.
Потому что тут как минимум довольно большие словосочетания и суффиксы, а как максимум – суть в сложнейшем контексте.
А без этого никак. Генерация текста под автора начинается с ограничения – чего не должно быть у автора, что должно быть обязательно.
Мария Фомальгаут 4 года назад #
Почему? Как компьютер это поймет?
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
И главный вопрос — чем мои тексты отличаются от текстов других авторов? Я ответа не знаю. Чем я отличаюсь? Кто я?
Нейросеть не ответит, её саму мордой тыкать надоть…
Aagira 4 года назад #
Вообще, есть тема — о чем говорится. Есть рема — что говорится о теме (если по-примитивному). На одной теме текст не выедет.
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
Или хотя бы с начала.
Или хотя бы оценить размеры бедствия. А они огромны.
Потому что в следующем блоге я задала вопрос, чем я отличаюсь от других авторов.
Сейчас ищу ответ…
Aagira 4 года назад #
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Aagira 4 года назад #
Нужно сымитировать длиннющий сайтовый ник, типа как у этого товарища: dabudetsolnce.ru/users/141
Желательно несколько вариантов.
Мария Фомальгаут 4 года назад #
Холодный, холодный оконный ветер… узорчатый час занавески Казнил окно, только потом признался, что у него жуткая фобия на котов, и выйдет он иногда весь прекрасный…
Часы короновали полночь, призрачная площадь велик бежал круглым хвостом. Сто королевств и кровей шёлковая связь
Aagira 4 года назад #
Ошибка тоже оттуда?
Мария Фомальгаут 4 года назад #
А вот герои с мого генератору:
Тюремный надзиратель ибис Паул, который мечтает научиться магии, умеет договариваться со всеми и больше всего на свете ценит собственную красоту.
Предложение Тайлер, которое работает мусоропроводчиком, жаждет власти, мечтает научиться летать и держит первенство в своей профессии.
Aagira 4 года назад #
Пример я тебе дала.
Нет, вру, не предложения. Но все равно, не то. Ты же не будешь выдумывать себе псевдоним со словом «который»?
Мария Фомальгаут 4 года назад #
Человек, который был четвергом (не мое)
Август, в который никто не придет (мое)
Там нет слова который, там вот так:
1). Выбор героя. слезинка.
2). Выбор имени. Лора.
3). Выбор профессии. бригадир железнодорожного пути.
4). Выбор настоящей цели. власть.
5). Выбор поддельной цели. свободу.
6). Выбор слабости. здоровье.
7). Выбор конечной цели, более приоритетной. репутацию. 8). Выбор конечной цели, которой изначально не было. близких.
9). Выбор чему хочет научиться. плавать.
10). Выбор способности. читать мысли.
11). Выбор внешности. кожа. 12). Выбор связки существительное-прилагательное для внешности.. 13). Выбор прилагательного для внешности. разговорный.
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Да нет, я, конечно, могу при тесте запулить «Сто королевств и кровей шёлковая связь», или узорчатый час занавески с ветром. Но вконтактовский бредогенератор ужасен.
Тем более, что надо именно персонажа, то есть, словосочетание или набор словосочетаний, а не полноценное предложение.
Мария Фомальгаут 4 года назад #
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #
Если же персонажа назвать, то все характеристики будут в начале. Например:
Метеоролог со слабым здоровьем и узбекской улыбкой синиц Чарльз, ценитель дружбы (всем здрасьте!)
Мария Фомальгаут 4 года назад #
2). Выбор имени. Джитта.
3). Выбор профессии. фальцовщик.
4). Выбор настоящей цели. что-то красивое.
5). Выбор поддельной цели. свободу.
6). Выбор слабости. Родину.
7). Выбор конечной цели, более приоритетной. справедливость. 8). Выбор конечной цели, которой изначально не было. материальный достаток.
9). Выбор чему хочет научиться. читать.
10). Выбор способности. умение договариваться со всеми.
11). Выбор внешности. уши. 12). Выбор связки существительное-прилагательное для внешности.. 13). Выбор прилагательного для внешности. надписанный.
Aagira 4 года назад #
Мария Фомальгаут 4 года назад #
И это пока план, а потом из этого плана будем отдельные фрагменты в готовый текст. Герой пошел туда-то — вставь название героя. К герою обратились по имени — вставь имя. Герой хочет что-то — вставь его цель.
Aagira 4 года назад #
Aagira 4 года назад #
Мрачное окраинное кафе Парижа, заплесневевшие круассаны, которыми, вероятно, питаются сточные духи*. Все пропитано демоническим флиртом, кровавыми вурдалакскими поцелуями.
Вполне такой романтический эпизодик.
_____
*Ударения для программы указывать тоже нужно.
Мария Фомальгаут 4 года назад #
Aagira 4 года назад #