Суп из LLM топора


Вы здесь: Авторские колонки FantLab > Авторская колонка «kdm» > Суп из LLM-топора
Поиск статьи:
   расширенный поиск »

Суп из LLM-топора

Статья написана 24 января 18:12

В одной из тем на фантлабе уже некоторое обсуждают возможность переводить художественные тексты нейросетью. Сразу оговорюсь, что меня не интересуют экзотические случаи: вы непременно хотите прочесть текст, написанный на языке, которого не знаете (хотите – читайте, кто я, чтобы вас отговаривать?), и проч. Мне было интересно, можно ли использовать нейросетевой перевод как черновик, для преодоления боязни чистого листа и так далее. По моим экспериментам и по тому, что показывают в той теме, вывод получается такой: на сегодня нейросетки переводят как плохой человеческий переводчик. Люди, конечно, и хуже умеют, но в сортах этого самого разбираться не обязательно. Понятно, что это огромный прорыв и все такое, но если вернуться к практической задаче, о которой уже задумываются некоторые издатели: можно ли удешевить и ускорить процесс, если переводить нейросеткой, а потом отдавать редактору, который доведет результат до ума? – то ответ: не стоит. Переписать можно и человеческий перевод любой степени кошмарности, и современный нейросетевой, но, честное слово, суп из топора, сколько хороших продуктов в него ни положи, будет отдавать деревяшкой и ржавчиной. Проще суп сразу начинать с мяса и картошки, а топором дрова колоть и так далее.

А теперь камингаут – я пользуюсь ИИ (преимущественно гугловским). Главным образом когда нужно распутать что-нибудь техническое. Допустим, мои герои собирают «томми-ган». Томпсоны в СССР поставляли по лендлизу, в инете есть инструкции по их сборке – разборке на русском, но чересчур подробные. И вот тут попросить ИИ: «объясни, что делают в этом отрывке» – работает действительно быстрее, чем разбираться с инструкцией. А уже примерно поняв, что происходит, я заполировала это дело просмотром ютубовского ролика (два дядьки разбирают и собирают «томми», рассказывая про каждую деталь с любовными интонациями Дроздова, держащего в руках рептилию). И всего-то в двух частностях ИИ наврал – назвал бронзу латунью и еще что-то в таком роде.

Или, допустим: показываю ему кусочек текста, говорю, это шутливый разговор о физике, перескажи мне его в научных терминах. Гугловский ИИ ужасно многословен – сообщает, из какой книги отрывок (ни разу не угадал), объясняет, какую мысль проводит автор (тоже обычно мимо), подробно объясняет каждое словосочетание (вот это он делает в целом правильно, только надо помнить, что ищет он по-английски, а для нашего разговора переводит на русский и может запросто обозвать принцип дополнительности принципом дополняемости и так далее), выводит какую-нибудь глубокую общечеловеческую мораль, предлагает собственный перевод отрывка (ни разу не выдал чего-нибудь стоящего), по три раза объясняет одно и то же – а мне это и надо, из его многословия я выуживаю зацепку для игры слов, которую не могла придумать. Только не надо просить его самого перевести игру слов – такая дрянь получается, что аж стыдно за беднягу.

Отдельная интересность: общение с ИИ, независимо от того, помог ли он мне распутать задачку или как-то особенно талантливо наврал, оставляет острое желание немедленно кому-нибудь про это рассказать. Интересно, это он так мой разум исподволь порабощает? Или уже поработил, раз я пошла это все писать в колонку, куда уже сто лет не писала?





477
просмотры





  Комментарии
Страницы: 12


Ссылка на сообщение28 января 05:56
цитата ArK
Отличить методом «слепого» теста?


Существуют объективные критерии качества перевода
— кол-во смысловых ниже какого-то предела
— стиль и тон более или менее в тему
— нормальный русский некорявый язык
— отсутсвие засилья было, который, что и личных местоимений
— причастия и отглагольные существительные по минимуму
— минимум калек
— чистенько: минимум стилистически немотивированных повторов
и т.д.

У нейронок пока пункты ниже третьего хромают так, что видно невооруженным взглядом.
свернуть ветку
 


Ссылка на сообщение28 января 10:00
Так пусть это покажет «слепой» тест.
 


Ссылка на сообщение28 января 10:16
Что «это»? Что нейронки переводят не хуже людей?
Видите ли, у слепого теста есть одна проблемка: «А судьи кто?».

Надеюсь, вам не нужно доказывать с пеной у рта, что рядовой обыватель и редактор нормального издательства оценивают текст по-разному. Оценка переводов вообще почва довольно зыбкая. Очень много вкусовщины и личных тараканов даже со стороны тех, кто профессионально занимается текстом. И все-таки объективные критерии существуют.
 


Ссылка на сообщение28 января 11:14
Или хуже переводят.

Например, в известном «суде Парижа» судьями были профессионалы/специалисты — дегустаторы вина.
 


Ссылка на сообщение28 января 11:36
Да не в этом дело. Что там профаны в слепом тесте натестят — совершенно не интересно и не валидно. Валидно обоснованное мнение эсперта. Слепой тест здесь — побоку.
 


Ссылка на сообщение28 января 11:45
Так это и были эксперты, а не профаны!
 


Ссылка на сообщение28 января 12:18
Не важно. Эксперты уже дали свое заключение. Слепой тест здесь ничего не изменит. Никакой 'обьективной' картины он не даст. Наоборот, это будет результат «здесь и сейчас» и не более того.
 


Ссылка на сообщение28 января 12:25
Так они дали заключение в «слепом» тесте!
 


Ссылка на сообщение28 января 12:30
Я надеюсь, вы не про «тест» на хабре?
 


Ссылка на сообщение28 января 12:40
ArK про то, что в 1976 г сомелье нашли калифорнийские вина лучше французских.
Почему это в данном случае не пример, вы и так поймете, а ArK'у мы с вами все равно не объясним.
 


Ссылка на сообщение28 января 12:44
Объяснять нужно не мне.
 


Ссылка на сообщение28 января 12:43
Я про «Суд Парижа». И это не единственный казус со «слепым» тестом.


Ссылка на сообщение28 января 06:04
цитата MariannaSmirnova
Добиваться от нейросети, чтобы она переводила как вы, -- почти настолько же бесполезное дело, как и добиваться от нее, чтобы она писала как вы.


Ну не знаю... существует машинное обучение. На платном аккаунте возможностей больше, можно накормить нейронку нужными текстами и натренировать на нужный стиль. И будет она писать похоже на вас.

цитата MariannaSmirnova
А вообще с нейропереводами будет другая засада. Допустим, условное издательство купило права на книгу и перевело ее на русский Дипсиком. Бесплатно. А затем этот бесплатный перевод то же издательство продает за деньги... Не должно ли оно заплатить владельцам Дипсика?


Вряд ли издательство будет переводить бесплатно. Возьмет платный аккаунт, т.к. на нём есть возможность кастомизировать нейронку под себя, т.е. увеличить КПД. Все что нейронки создают бесплатно, сейчас является объектом creative commons (то бишь общее), а на платных аккаунтах обычно результат принадлежит тому, кто оплатил.


Ссылка на сообщение29 января 11:19
Сам я дела с ИИ не имел (не интересно — если уж разбираться в вопросе, то по источникам и своей головой; часто в процессе поиска всплывают ответы на проблемы, попавшиеся выше, или пропущенные — бывает, даже не знаешь что проблема есть), но иногда редактирую присланные переводы, вышедшие из-под кривых транзисторов нейросети или ей же обработанные.
Переводы-то приличные, у нас в 90-ые живые люди на бумаге переводили гораздо хуже. А вот со стилем и подбором слов часто швах. Машина тупая — как видит, так и переводит. Не дай бог перенос в каком-нибудь редком слове попадётся — и будет тебе что угодно, от странного предложения до нового персонажа. Да ещё и приврать нейросеть тоже не дура. А если уж тут и автор где-то ошибся (скажем, имена в далоге перепутал), то будет полное счастье.
Поэтому хорошая редактура невозможна без оригинала и хотя бы общего знания мира произведения, а то и консультаций у спецов по узким вопросам. Но для экспресс-знакомства с текстом (смысл, сюжет, структура) нейроперевод вполне достаточен уже сейчас.
Непритязательные читатели лопают нейропереводы не хуже дешёвых сухариков — вроде бы и в мозг что-то попало, и наелся быстро любимым автором. А что везде лишние указательные местоимения россыпью или английские модели предложений... так люди обычно и не замечают.
свернуть ветку
 


Ссылка на сообщение29 января 21:51
цитата Ny
часто в процессе поиска всплывают ответы на проблемы, попавшиеся выше, или пропущенные — бывает, даже не знаешь что проблема есть

Справедливости ради, с ИИ так тоже бывает. Ща расскажу стыдную историю про себя. Пока собиралась писать это текст для колонки, закинула в Дипсик несколько отрывков из своей книги, чтобы голословно ИИ не ругать. И вот Дипсик мне в отрывке слова «Princess Alexandra Kropotkin, a lineal descendant of Rurik the Varangian» переводит как «княжна Александра Кропоткина, прямая потомка Рюрика-варяга». И у меня резко пропадает желание смеяться над второй половиной фразы, потому что я осознаю, что с разбега назвала бы ее княгиней, при том что уже кое-что про нее прочла и знала, что она дочь того Кропоткина.
цитата Ny
Непритязательные читатели

У меня вот теперь праздный вопрос, не знаю, как выяснить: множество людей, которые ругают нейросетевые обложки, и множество людей, которые хвалят нейросетевые переводы — они пересекаются? Хорошо бы какой-нибудь энтузиаст нейросетевых переводов пришел и рассказал, нравятся ли ему нейросетевые обложки.
 


Ссылка на сообщение30 января 06:18
цитата kdm
И у меня резко пропадает желание смеяться над второй половиной фразы, потому что я осознаю, что с разбега назвала бы ее княгиней, при том что уже кое-что про нее прочла и знала, что она дочь того Кропоткина.
Ну бывает. Задумался человек. Поэтому я тексты стараюсь сначала переводить вчерне — общий смысл, лексика, синтаксис, выправление фактических ошибок автора. Затем шлифовка на грамматику, фразеологию и стиль вообще. А потом неплохо бы кому показать, чтобы блох выловил и за логикой последил. Ну и не гнушаюсь посмотреть, как «конкуренты» перевели проблемные места (если переводы уже имеются).
Понятно, что программа всё это сделает быстрее, но за ней глаз да глаз нужен. Она же не соображает что переводит, она переводит «как». И это «как» мне не нравится.
Впрочем, я любитель. Неоднократно слышал, что профи переводят всё сразу, при затруднениях консультируясь с ИИ. Видимо, вопрос удобства.
цитата kdm
У меня вот теперь праздный вопрос, не знаю, как выяснить: множество людей, которые ругают нейросетевые обложки, и множество людей, которые хвалят нейросетевые переводы — они пересекаются?
Что тут сказать... Далеко не всем произведениям нужна дорогая обложка, выполненная художником на заказ. Для плёвых повестей, написанных за неделю на какой-нибудь легковесный конкурс, или одноразовых романв типа «кулёк семечек» хорошо подходит и генерация. Но если (как было с последним Сапковским) публикуется что-то с претензией на крутость и монументальность, то зачем вообще связываться с нейронкой? По-моему, так.
В какой-то мере это подходит и к переводам. Некоторых авторов можно смело доверить ИИ. Хуже они от этого не станут. Во всяком случае, для своего читателя.


Ссылка на сообщение30 января 18:16
цитата kdm
Хорошо бы какой-нибудь энтузиаст нейросетевых переводов пришел и рассказал, нравятся ли ему нейросетевые обложки.


Я одно время сильно увлекалась нейросетевой графикой. Думаю, тут как с переводами, чем больше человеческих усилий вложено, тем лучше результат.

1. Знакомый нейроблоггер из ТГ с нейросетевой фотографией (в порядке эксперимента) выиграл в конкурсе живых фотографов.
2. Читала ещё об одном человеке, который победил с нейрофото в конкурсе фотографов
3. Ещё один человек выиграл с нейрокартинкой в конкурсе художников. Было это несколько лет назад, потратил он на редактирование картинки месяц.

Предназначение нейронки — накидывать идеи и давать общую канву, на основе которой человек может сваять даже шедевр. В чистом виде нейрокартинки в подавляющем своём большинстве на обложку не годятся. Нейронкам свойственно оставлять артефакты (не идеально круглые зрачки, шестые пальцы, огрехи в одежде).
свернуть ветку
 


Ссылка на сообщение30 января 21:01
Спасибо. Вот с поиском у меня так получается, так что в целом я могу понять, о чем речь.
 


Ссылка на сообщение31 января 16:44
цитата
В чистом виде нейрокартинки в подавляющем своём большинстве на обложку не годятся. Нейронкам свойственно оставлять артефакты (не идеально круглые зрачки, шестые пальцы, огрехи в одежде).

Эти огрехи давно уже не актуальны. У нормальных T2I-сеток (и нашего Яндекс-Арта в том числе) все в порядке со всем выше перечисленным. :) Совершенно реально использовать их генерации в оформлении. Допиливать что-либо в фотошопе — это уже на вкус оформителя.
 


Ссылка на сообщение31 января 19:19
Что и при маштабировании артефакты не вылезают? Печатное разрешение 300 dpi.
Когда была в теме, сначала генерировали, потом правили, потом маштабировали (тоже нейронкой) и снова правили.
 


Ссылка на сообщение31 января 20:10
наверное, вы давно этим занимались. да, какое-то время назад (пару лет назад, наверное) перечисленные вами проблемы действительно имели место (особенно с пальцами, да). теперь сетки допилили (дообучали, то бишь) — огрехи если и вылезают, то крайне редко. я уж и думать про них забыл.

что до масштабирования — то это уже проблемы апскейлеров, а не самих T2I-систем. хотя и апскейлеры сейчас — любо-дорого посмотреть, хотя и приврать могут (в творческом смысле), но степень их «творческости» обычно регулируется.
 


Ссылка на сообщение31 января 20:44
Мне еще не нравится в нейрографике надоевший до оскомины стиль нейронок. Когда видел много картинок, уже понимаешь: вот это из Миджорни, это Стейбл, это Плейграунд, а это Dalle. Конечно, бывают очень креативные промты, где нейронку с ходу не узнаешь (или уже пофиг, что это нейросеть), но большая часть — серая масса. Мне бы не хотелось увидеть на обложке книги картинку из этой массы. Я имею в виду продукцию крупных издательств. Самиздату простительно лепить на обложки, что угодно.
 


Ссылка на сообщение31 января 21:52
разумеется, если промпт «никакой», то и результат будет максимально усредненный (то есть, «серый», как вы говорите). не зря же целая новая специальность образовывается сейчас — промпт-инженер (не только применительно к нейрографике).
нейросеть ведь — только инструмент, мастерство владения им (и, соответственно, результат) — зависит от человека.
Страницы: 12

⇑ Наверх