Тема «Переводы и переводчики. Нейроэнтузиасты, объединяйтесь!»

Вы здесь: Форумы fantlab.ru > Форум «Другие окололитературные темы» > Тема «Переводы и переводчики. Нейроэнтузиасты, объединяйтесь!»

Переводы и переводчики. Нейроэнтузиасты, объединяйтесь!

Страницы: 1 2 3...34 35 36 37 38...46 47 48 🔍 поиск написать сообщение

автор

сообщение

активист

23 января 10:27

цитировать | [ ]

Хочу поделиться личным наблюдением. Если Дипсик после долгого использования начинает блажить, т. е. сбиваться с переводом или пропускать фразы и вообще вести себя как заезженная пластинка — надо перезапустить его по новой со стартовой страницы в Яндексе. Сразу повышается качество и стиль перевода.

авторитет

23 января 10:30

цитировать | [ ]

цитата misanthe
элегемма

Что за элегемма? Незнакомое слово, не гуглится.

активист

24 января 09:00

цитировать | [ ]

Советую добавить в промпты по Дипсику следующую фразу:

Знак ; (точка с запятой) следует рассматривать как разбивку длинного предложения на два отдельных самостоятельных, не нарушая общего смысла фразы.

Отличное средство избавиться от "гусениц" и составных предложений!

авторитет

24 января 14:50

цитировать | [ ]

цитата фэйри тэйл
Советую добавить в промпты по Дипсику следующую фразу:

Лучше наверное так: не копируй английский синтаксис механически. Встретив знак ";" (точка с запятой) заменяй его на другие знаки пунктуации (точка, тире, двоеточие в зависимости от ситуации). Стремись к максимально естественному для русского строю фразы.

Протестировать пока не могу. Интернет сегодня черепаший. Половина сайтов не грузится.

активист

24 января 16:23

цитировать | [ ]

цитата SupeR_StaR
Встретив знак ";" (точка с запятой) заменяй его на другие знаки пунктуации (точка, тире, двоеточие в зависимости от ситуации)

Тогда предложение всё равно получается слишком длинное и в нем обычно хватает и своих запятых. Лучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.

авторитет

24 января 17:29

цитировать | [ ]

цитата фэйри тэйл
Тогда предложение всё равно получается слишком длинное и в нем обычно хватает и своих запятых. Лучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.

Для вас, наверное, да. Ведь ваши тексты предполагают минимум последующей редактуры. В более общем же случае длина фразы — особенность стиля, и бездумно кромсать предложение по точкам с запятой вряд ли стоит.

активист

26 января 16:11

цитировать | [ ]

цитата фэйри тэйл
Лучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.

Тут, боюсь, пока только человек сможет понять, относится ли это к художественному замыслу (как писала SupeR_StaR выше), или это просто специфика языка/автора, с которой можно и побороться.

Вот например взять, и сократить предложения в введении к Terra Ignota. И ой. Ибо там не неумение или тяжеловесность автора (она дальше вполне себе укоротилась там, где надо), а именно художественный приём. Причём который прямо и указан как таковой в самом же тексте, мол:

цитата
....so it is only in the language of the Enlightenment, rich with opinion and sentiment, that those days can be described.

Может быть LLM и сможет это распознать, но ей тогда под это нужно явно в промте писать — мол проанализируй текст, найди где автор использует длину и сложность языка и предложений как выразительный элемент, подстрой перевод...

Только для этого нужно, чтобы ИИ-шка всю книгу в контексте держала. А тут не только лишь каждая справится, токены могут кончиться.

Но для подстрочника, если вы про него — это не важно, наверное.

активист

26 января 16:57

цитировать | [ ]

цитата bor-ka
Но для подстрочника, если вы про него — это не важно, наверное

Хочу вспомнить рассказ К.Г. Паустовского "О знаках препинания", где редактор, не меняя не единого слова, просто расставил по-своему знаки препинания (точка — тоже знак препинания!) и тем сделал текст писателя намного лучше. Коррекция авторского текста в сторону улучшения его читаемости не стоит порицать. В противном случае мы будем иметь тот самый подстрочник. Не все фразы, складно звучащие по-английски, могут без ущерба быть перенесены на русский язык. А точка с запятой в составном предложении уже сама по себе есть разграничительная логическая линия и в русских текстах почти не употребляется, хотя в английской грамматике используется слишком уж часто. Помню, как меня самого здесь же ругали за цепочки "гусениц", хотя они есть не более чем изложение авторской мысли англоязычного писателя. И опять же, речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях. И уверяю, что мои переводы с помощью Дипсика совсем не безликие подстрочники.

активист

26 января 18:42

цитировать | [ ]

цитата фэйри тэйл
А точка с запятой в составном предложении уже сама по себе есть разграничительная логическая линия и в русских текстах почти не употребляется, хотя в английской грамматике используется слишком уж часто.

Частотность употребления — отдельная история, данных у меня нет. Но в русском языке она имеет место так же быть, и в классике использовалась. В современном рубленом — возможно нет. Точнее даже не так, в русском она вроде используется если составные сложные, а в английском — если независимые, но любые.

Ну и в английском она ещё в перечислениях встречается, причём очень по делу. Если по ней бить — белиберда будет.

цитата фэйри тэйл
И опять же, речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях.

Ну я вам кусок из очень развлекательного произведения привёл, обычная фантастика, коих много есть. Не боллитра ни разу, не говоря о философии.

Пытаюсь сказать одно — нельзя однозначно упрощать язык автора, ибо это может быть его — автора — неуклюжесть, и тогда вы правы. А может быть художественный приём. И вот во втором случае, если ИИ сможет распознать, то отлично. А нет — у вас либо потеряется смысл в стилизации, либо кто-то учёный или просветитель из Средневековья заговорит как шкет.

Для технического перевода — это не страшно. Для художественного — не очень хорошо.

Надо не механистически бить по точкам с запятым, а брать например как SupeR_StaR предлагала пару недель назад про вставные конструкции.

авторитет

27 января 02:19

цитировать | [ ]

цитата bor-ka
Частотность употребления — отдельная история, данных у меня нет.

.
У англичан очень любили точку с запятой авторы 19 века и начала 20 (у нас тоже, но не так сильно). В частности, Вирджиния Вулф. На ее русских переводах можно глянуть, как с этим знаком препинания разбирались переводчики. Как успела увидеть, вот тут сохранили. Насколько знаю, при переводе точку с запятой рекомендовано заменять другими знаками препинания, но тут, как видно, особенность стиля.

Сейчас и у них, и у нас точка с запятой теряет популярность. Есть интересная книжка об английской пунктуации (Трасс Линн — Казнить нельзя помиловать. Бескомпромиссный подход к пунктуации). Автор англоязычный. В частности она пишет и о точке с запятой (для чего используется, чем отличается от точки и других знаков препинания, каковые тенденции: снижается частота употребления).

цитата bor-ka
Тут, боюсь, пока только человек сможет понять, относится ли это к художественному замыслу (как писала SupeR_StaR выше), или это просто специфика языка/автора, с которой можно и побороться.

).

Говоря несколькими постами выше о том, что точку с запятой не стоит бездумно заменять точкой, я имела в виду вот что. Допустим у вас текст автора 19 века (длинные абзацы; длинные фразы с несколькими точками с запятой чуть ли не в каждой; и в целом ощущение довольно "вязкой" прозы). Что с таким текстом делать, зависит от приоритетов. Можно и фразы разбить, и абзацы, чтобы легче воспринималось, но это будет уже несколько другой по ощущениям автор.

Недавно попался интересный с переводческой точки зрения текст. Авторша современная, но умышленно косит под викторианцев. У нее на 5500 знаков 12 точек с запятой. Так вышло, что я оставила 11 ";". Не стоило?
Я на этот текст не успела потереть сессии с переводом (пробовала в работе промпт собственного приготовления)
и со шлифовкой перевода

активист

27 января 07:09

цитировать | [ ]

цитата SupeR_StaR
Что с таким текстом делать, зависит от приоритетов

Очень правильная мысль.

цитата bor-ka
это может быть его — автора — неуклюжесть

Обычно так и бывает с авторами, которых я беру для перевода

цитата фэйри тэйл
речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях.

а это мой ответ на обвинение в том, что я искажаю мысли великих классиков.

По мнению Дипсика, 70-85%% всей художественной литературы относится к чисто развлекательному жанру. Именно о переводе таких книг я и веду речь. Это значит, что они должны быть удобны для чтения, даже если автор не вполне в ладах со стилистикой.

авторитет

27 января 17:09

цитировать | [ ]

Слепой тест переводов на Хабре
10 мая 2025
https://habr.com/ru/articles/908280/

Выводы

скрытый текст (кликните по нему, чтобы увидеть)

Первое: Хабр и люди спокойно отличают достойный человеческий перевод от машинного — 3 результат идет с сильным разрывом от всех остальных.

5 результат (человеческий) также выше нейросетей — при том, что лично мне он не очень понравился, и я, выкладывая опрос, предполагал, что он будет выбран на уровне нейросетевых моделей. Но я ошибся; оказывается, вкусы бывают разные.

Второе: Платные топовые нейросети пока в среднем не дотягивают до человеческого перевода — даже до уровня Перевода 5. Однако при выборе наилучшего варианта часть пользователей отдала голоса нейросетевым вариантам — видимо, для некоторых людей они правда ощущаются лучше. Даже я вхожу в их число, но не на этом тексте.

При этом разные пользователи склонны выбирать разные нейросети в качестве наилучших. На заметку: если вам не нравится перевод, возможно, вы просто не нашли еще ту сеть, которая бы попадала в ваш личный вайб.

Третье: Платные топовые нейросети (7-10) значительно отличаются по средней читабельности от бесплатных вариантов, предоставляемых в разных чатах.

Интересно, что лично мне больше понравился вариант o4-mini (10) — при том, что я предпочитаю Sonnet (7). Однако пользователи посчитали максимально высоко читабельным и 10, и 7 вариант. Также пользователи высоко оценили Grok 3 (9), хотя мне он не понравился.

Четвертое: среди бесплатных не LLM-вариантов достаточно достойно показал себя Яндекс.Переводчик (11). Хотя по отзывам люди предпочитают Google и DeepL, я замечал, что вариант от Яндекса как-то недооценен, про него редко вспоминают.

Пятое: в комментариях предложили логичную идею — что нужен, в общем, не только переводчик, но и редактор. Я сделал перевод после статьи на связке Sonnet 3.5 (переводичк) + o4-mini (редактор) в комментарии здесь. На мой взгляд, получилось достаточно интересно.

авторитет

27 января 23:11

цитировать | [ ]

цитата фэйри тэйл
По мнению Дипсика, 70-85%% всей художественной литературы относится к чисто развлекательному жанру.

Так называемая коммерческая литература. Б. Акунин интересно ее разграничил с просто литературой.

цитата
Литература всегда экспериментальна, она предполагает новаторство. Писатель имеет шанс стать таковым только в том случае, если он собирается писать так, как никто до него. Двух одинаковых «литератур» не бывает. Понимаете, о чем я? Даже если стилистически текст написан очень сложно, даже если автор в нем поднимает какую-то невероятно трагическую тему, это еще не делает текст литературой. Это все равно будет беллетристика, если писатель повторяет методы, опробованные уже кем-то до него. Например, первый раз написанный «Улисс» Джойса – это литература; когда же тот или иной автор начинает использовать «поток сознания» вслед за Молли Блум, это уже не литература – это беллетристика. Даже если она написана в десять раз сложнее Джойса.

авторитет

28 января 04:18

цитировать | [ ]

Попалась на Хабре интересная статья "Навыки, которые вы теряете, пока ИИ берет на себя рутинные задачи". Автор рассматривает вопрос в разрезе программирования. Что до переводов, то переводить при помощи ИИ проще, но тоже не полезно. Существует правило 10 000 часов, согласно которому кол-во однажды переходит в качество. Для переводчика оно означает, что после определённой массы текста, вариант перевода формируется в голове автоматически и очень быстро, без долгого перебора вариантов. После интенсивного перевода с ИИ, этот автоматизм атрофируется за ненадобностью и скорость самостоятельного перевода падает.

гранд-мастер

28 января 07:14

цитировать | [ ]

цитата SupeR_StaR
Для переводчика оно означает, что после определённой массы текста, вариант перевода формируется в голове автоматически и очень быстро, без долгого перебора вариантов.

Так и есть. Если текст несложный, то скорость перевода ограничивается только скоростью набора на клавиатуре. Это быстрее, чем переписывать редактировать гугловский или нейросетевой. Да, кое-кто с ИИ книгу за сутки переводит, но о каком редактировании тут может идти речь, если за сутки чисто физически такой объем невозможно даже просто прочитать?

–––
Чернила соблазнительны. Они имеют нечто общее с вином, чтобы не сказать с кровью. - Петр Вяземский

активист

28 января 08:31

цитировать | [ ]

Anahitta

цитата Anahitta
Да, кое-кто с ИИ книгу за сутки переводит, но о каком редактировании тут может идти речь, если за сутки чисто физически такой объем невозможно даже просто прочитать?

Вообще, то, у меня процесс редактирования книги, переведенной с ИИ, идет параллельно с ее чтением и занимает чуть больше времени, чем обычное чтение, лишь потому, что читать приходится внимательно и без пропуска слов. Книга в 300-400 страниц переводится без особой спешки за неделю. Сложность возникает лишь в в первых главах, когда надо сформировать матрицу имен и понятий, а дальше надо лишь исправлять опечатки и двусмысленности.
Здесь много говорится, что надо обязательно проводить векторный анализ текста и задавать ИИ эмоциональные установки для перевода с помощью хитрых промптов. Но почему все решили, что подобные промпты не были изначально заложены в программу ИИ ее разработчиками? Там ведь тоже работают профессионалы высокого класса!
Хочу также присоединиться к благодарностям Anahitta за её перевод Б. Макклеллана. Долгая тщательная работа должна быть отмечена благодарными восторгами читателей!

активист

28 января 08:49

цитировать | [ ]

цитата фэйри тэйл
Но почему все решили, что подобные промпты не были изначально заложены в программу ИИ ее разработчиками? Там ведь тоже работают профессионалы высокого класса!

Если бы это была специализированная сетка, натренированная на переводы, ну или хотя бы приложение с агентами и системными промтами — то да. Но deepsek, qwen и прочий GLM — это не оно.

А обычные сетки широкого профиля тренируются на другом, про переводы они ничего не знают априори. И в массиве данных из интернета для обучения таких примеров хорошо если единицы. Их основная и единственная задача — правдоподобно продолжать начатый текст, как его продолжил бы человек. Всё.

Поэтому общеязыковые лингвистические конструкции и отчасти общие смысловые — оно "понимает" (насколько можно это слово применить к "Китайской комнате" — но это уже философский вопрос, а не практический про перевод). А вот энциклопедические знания, специальные методики или прочее — ей (сетке) нужно скармливать в промт, примерно как делала SupeR_StaR в своём примере с уточняющими предложениями.

Либо вручную, либо при помощи системных промтов, данных агентов и прочего, с чего я начал выше :)

TL;DR — общеупотребимые модели типа qwen/deepseek/gemini/... — машина по подбору слов в красивом порядке. Оно натренировано на механизмах языка и базовых смыслах. Специальные знания ей надо подавать на вход.

активист

28 января 09:35

цитировать | [ ]

цитата SupeR_StaR
Попалась на Хабре интересная статья "Навыки, которые вы теряете, пока ИИ берет на себя рутинные задачи". Автор рассматривает вопрос в разрезе программирования.

Автор говорит с точки зрения программиста-кодера, и в таком случае он прав. Но я, например, алгоритмист. Мне трудно программировать, так как я плохо помню названия команд и их синтаксис. И дело тут не в практике: я и слова на русском забываю. Поэтому и программирование, и перевод для меня всегда были вызовами, причём не особо интересными. Но с появлением LLM задачи запоминания слов и синтаксиса они взяли на себя. А вот алгоритмы теперь мои. И я вновь вернулся к программированию и занялся переводом. Такое чувство, как будто человеку с ДЦП дали нейронные манипуляторы.

активист

28 января 09:45

цитировать | [ ]

цитата bor-ka
TL;DR — общеупотребимые модели типа qwen/deepseek/gemini/... — машина по подбору слов в красивом порядке. Оно натренировано на механизмах языка и базовых смыслах. Специальные знания ей надо подавать на вход.

Это не совсем так. Специальные знания там тоже есть. Только важен контекст. Его модель не всегда может правильно определить. Большинство ошибок, с которыми я сталкивался, были именно из-за этого.

активист

28 января 09:58

цитировать | [ ]

цитата bor-ka
А обычные сетки широкого профиля тренируются на другом, про переводы они ничего не знают априори.

Насчет Дипсика я не согласен. Этот ИИ определяет жанр переводимого отрывка текста произведения и его эмоциональную окраску без всякого намека с моей стороны. Даже по его комментариям заметно, как он оценивает напряженность сюжета и его эмоциональную подоплеку. Загрузите несколько страниц из электронной книги, не указывая ее происхождения, и попросите перевести как литературный текст — сами в этом убедитесь. И еще надо различать Дипсик лета прошлого года и Дипсик после декабря — совсем разный качественный уровень перевода. Говорю это как постоянный пользователь этой программы с марта 2025 г.