| автор |
сообщение |
фэйри тэйл 
 активист
      
|
23 января 10:27 [нажмите здесь чтобы увидеть текст поста]
|
|
Хочу поделиться личным наблюдением. Если Дипсик после долгого использования начинает блажить, т. е. сбиваться с переводом или пропускать фразы и вообще вести себя как заезженная пластинка — надо перезапустить его по новой со стартовой страницы в Яндексе. Сразу повышается качество и стиль перевода.
|
|
|
SupeR_StaR 
 авторитет
      
|
|
фэйри тэйл 
 активист
      
|
24 января 09:00 [нажмите здесь чтобы увидеть текст поста]
|
|
Советую добавить в промпты по Дипсику следующую фразу:
Знак ; (точка с запятой) следует рассматривать как разбивку длинного предложения на два отдельных самостоятельных, не нарушая общего смысла фразы.
Отличное средство избавиться от "гусениц" и составных предложений!
|
|
|
SupeR_StaR 
 авторитет
      
|
24 января 14:50 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйлСоветую добавить в промпты по Дипсику следующую фразу:
Лучше наверное так: не копируй английский синтаксис механически. Встретив знак ";" (точка с запятой) заменяй его на другие знаки пунктуации (точка, тире, двоеточие в зависимости от ситуации). Стремись к максимально естественному для русского строю фразы.
Протестировать пока не могу. Интернет сегодня черепаший. Половина сайтов не грузится.
|
|
|
фэйри тэйл 
 активист
      
|
24 января 16:23 [нажмите здесь чтобы увидеть текст поста]
|
цитата SupeR_StaRВстретив знак ";" (точка с запятой) заменяй его на другие знаки пунктуации (точка, тире, двоеточие в зависимости от ситуации) Тогда предложение всё равно получается слишком длинное и в нем обычно хватает и своих запятых. Лучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.
|
|
|
SupeR_StaR 
 авторитет
      
|
24 января 17:29 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйлТогда предложение всё равно получается слишком длинное и в нем обычно хватает и своих запятых. Лучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.
Для вас, наверное, да. Ведь ваши тексты предполагают минимум последующей редактуры. В более общем же случае длина фразы — особенность стиля, и бездумно кромсать предложение по точкам с запятой вряд ли стоит.
|
|
|
bor-ka 
 активист
      
|
26 января 16:11 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйлЛучше длинную составную фразу разрезать в месте наименьшего логического сцепления слов.
Тут, боюсь, пока только человек сможет понять, относится ли это к художественному замыслу (как писала SupeR_StaR выше), или это просто специфика языка/автора, с которой можно и побороться.
Вот например взять, и сократить предложения в введении к Terra Ignota. И ой. Ибо там не неумение или тяжеловесность автора (она дальше вполне себе укоротилась там, где надо), а именно художественный приём. Причём который прямо и указан как таковой в самом же тексте, мол:
цитата ....so it is only in the language of the Enlightenment, rich with opinion and sentiment, that those days can be described.
Может быть LLM и сможет это распознать, но ей тогда под это нужно явно в промте писать — мол проанализируй текст, найди где автор использует длину и сложность языка и предложений как выразительный элемент, подстрой перевод...
Только для этого нужно, чтобы ИИ-шка всю книгу в контексте держала. А тут не только лишь каждая справится, токены могут кончиться.
Но для подстрочника, если вы про него — это не важно, наверное.
|
|
|
фэйри тэйл 
 активист
      
|
26 января 16:57 [нажмите здесь чтобы увидеть текст поста]
|
цитата bor-kaНо для подстрочника, если вы про него — это не важно, наверное Хочу вспомнить рассказ К.Г. Паустовского "О знаках препинания", где редактор, не меняя не единого слова, просто расставил по-своему знаки препинания (точка — тоже знак препинания!) и тем сделал текст писателя намного лучше. Коррекция авторского текста в сторону улучшения его читаемости не стоит порицать. В противном случае мы будем иметь тот самый подстрочник. Не все фразы, складно звучащие по-английски, могут без ущерба быть перенесены на русский язык. А точка с запятой в составном предложении уже сама по себе есть разграничительная логическая линия и в русских текстах почти не употребляется, хотя в английской грамматике используется слишком уж часто. Помню, как меня самого здесь же ругали за цепочки "гусениц", хотя они есть не более чем изложение авторской мысли англоязычного писателя. И опять же, речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях. И уверяю, что мои переводы с помощью Дипсика совсем не безликие подстрочники.
|
|
|
bor-ka 
 активист
      
|
26 января 18:42 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйл А точка с запятой в составном предложении уже сама по себе есть разграничительная логическая линия и в русских текстах почти не употребляется, хотя в английской грамматике используется слишком уж часто.
Частотность употребления — отдельная история, данных у меня нет. Но в русском языке она имеет место так же быть, и в классике использовалась. В современном рубленом — возможно нет. Точнее даже не так, в русском она вроде используется если составные сложные, а в английском — если независимые, но любые.
Ну и в английском она ещё в перечислениях встречается, причём очень по делу. Если по ней бить — белиберда будет.
цитата фэйри тэйлИ опять же, речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях.
Ну я вам кусок из очень развлекательного произведения привёл, обычная фантастика, коих много есть. Не боллитра ни разу, не говоря о философии.
Пытаюсь сказать одно — нельзя однозначно упрощать язык автора, ибо это может быть его — автора — неуклюжесть, и тогда вы правы. А может быть художественный приём. И вот во втором случае, если ИИ сможет распознать, то отлично. А нет — у вас либо потеряется смысл в стилизации, либо кто-то учёный или просветитель из Средневековья заговорит как шкет.
Для технического перевода — это не страшно. Для художественного — не очень хорошо.
Надо не механистически бить по точкам с запятым, а брать например как SupeR_StaR предлагала пару недель назад про вставные конструкции.
|
|
|
SupeR_StaR 
 авторитет
      
|
27 января 02:19 [нажмите здесь чтобы увидеть текст поста]
|
цитата bor-kaЧастотность употребления — отдельная история, данных у меня нет. . У англичан очень любили точку с запятой авторы 19 века и начала 20 (у нас тоже, но не так сильно). В частности, Вирджиния Вулф. На ее русских переводах можно глянуть, как с этим знаком препинания разбирались переводчики. Как успела увидеть, вот тут сохранили. Насколько знаю, при переводе точку с запятой рекомендовано заменять другими знаками препинания, но тут, как видно, особенность стиля.
Сейчас и у них, и у нас точка с запятой теряет популярность. Есть интересная книжка об английской пунктуации (Трасс Линн — Казнить нельзя помиловать. Бескомпромиссный подход к пунктуации). Автор англоязычный. В частности она пишет и о точке с запятой (для чего используется, чем отличается от точки и других знаков препинания, каковые тенденции: снижается частота употребления).
цитата bor-kaТут, боюсь, пока только человек сможет понять, относится ли это к художественному замыслу (как писала SupeR_StaR выше), или это просто специфика языка/автора, с которой можно и побороться. ).
Говоря несколькими постами выше о том, что точку с запятой не стоит бездумно заменять точкой, я имела в виду вот что. Допустим у вас текст автора 19 века (длинные абзацы; длинные фразы с несколькими точками с запятой чуть ли не в каждой; и в целом ощущение довольно "вязкой" прозы). Что с таким текстом делать, зависит от приоритетов. Можно и фразы разбить, и абзацы, чтобы легче воспринималось, но это будет уже несколько другой по ощущениям автор.
Недавно попался интересный с переводческой точки зрения текст. Авторша современная, но умышленно косит под викторианцев. У нее на 5500 знаков 12 точек с запятой. Так вышло, что я оставила 11 ";". Не стоило? Я на этот текст не успела потереть сессии с переводом (пробовала в работе промпт собственного приготовления) и со шлифовкой перевода
|
|
|
фэйри тэйл 
 активист
      
|
27 января 07:09 [нажмите здесь чтобы увидеть текст поста]
|
цитата SupeR_StaRЧто с таким текстом делать, зависит от приоритетов Очень правильная мысль.
цитата bor-kaэто может быть его — автора — неуклюжесть Обычно так и бывает с авторами, которых я беру для перевода
цитата фэйри тэйл речь идет не о философских трактатах или жемчужинах мировой словесности, а об обычных развлекательных произведениях. а это мой ответ на обвинение в том, что я искажаю мысли великих классиков.
По мнению Дипсика, 70-85%% всей художественной литературы относится к чисто развлекательному жанру. Именно о переводе таких книг я и веду речь. Это значит, что они должны быть удобны для чтения, даже если автор не вполне в ладах со стилистикой.
|
|
|
ArK 
 авторитет
      
|
27 января 17:09 [нажмите здесь чтобы увидеть текст поста]
|
Слепой тест переводов на Хабре 10 мая 2025 https://habr.com/ru/articles/908280/
Выводы
скрытый текст (кликните по нему, чтобы увидеть) Первое: Хабр и люди спокойно отличают достойный человеческий перевод от машинного — 3 результат идет с сильным разрывом от всех остальных.
5 результат (человеческий) также выше нейросетей — при том, что лично мне он не очень понравился, и я, выкладывая опрос, предполагал, что он будет выбран на уровне нейросетевых моделей. Но я ошибся; оказывается, вкусы бывают разные.
Второе: Платные топовые нейросети пока в среднем не дотягивают до человеческого перевода — даже до уровня Перевода 5. Однако при выборе наилучшего варианта часть пользователей отдала голоса нейросетевым вариантам — видимо, для некоторых людей они правда ощущаются лучше. Даже я вхожу в их число, но не на этом тексте.
При этом разные пользователи склонны выбирать разные нейросети в качестве наилучших. На заметку: если вам не нравится перевод, возможно, вы просто не нашли еще ту сеть, которая бы попадала в ваш личный вайб.
Третье: Платные топовые нейросети (7-10) значительно отличаются по средней читабельности от бесплатных вариантов, предоставляемых в разных чатах.
Интересно, что лично мне больше понравился вариант o4-mini (10) — при том, что я предпочитаю Sonnet (7). Однако пользователи посчитали максимально высоко читабельным и 10, и 7 вариант. Также пользователи высоко оценили Grok 3 (9), хотя мне он не понравился.
Четвертое: среди бесплатных не LLM-вариантов достаточно достойно показал себя Яндекс.Переводчик (11). Хотя по отзывам люди предпочитают Google и DeepL, я замечал, что вариант от Яндекса как-то недооценен, про него редко вспоминают.
Пятое: в комментариях предложили логичную идею — что нужен, в общем, не только переводчик, но и редактор. Я сделал перевод после статьи на связке Sonnet 3.5 (переводичк) + o4-mini (редактор) в комментарии здесь. На мой взгляд, получилось достаточно интересно.
|
|
|
SupeR_StaR 
 авторитет
      
|
27 января 23:11 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйлПо мнению Дипсика, 70-85%% всей художественной литературы относится к чисто развлекательному жанру. Так называемая коммерческая литература. Б. Акунин интересно ее разграничил с просто литературой.
цитата Литература всегда экспериментальна, она предполагает новаторство. Писатель имеет шанс стать таковым только в том случае, если он собирается писать так, как никто до него. Двух одинаковых «литератур» не бывает. Понимаете, о чем я? Даже если стилистически текст написан очень сложно, даже если автор в нем поднимает какую-то невероятно трагическую тему, это еще не делает текст литературой. Это все равно будет беллетристика, если писатель повторяет методы, опробованные уже кем-то до него. Например, первый раз написанный «Улисс» Джойса – это литература; когда же тот или иной автор начинает использовать «поток сознания» вслед за Молли Блум, это уже не литература – это беллетристика. Даже если она написана в десять раз сложнее Джойса.
|
|
|
SupeR_StaR 
 авторитет
      
|
28 января 04:18 [нажмите здесь чтобы увидеть текст поста]
|
Попалась на Хабре интересная статья "Навыки, которые вы теряете, пока ИИ берет на себя рутинные задачи". Автор рассматривает вопрос в разрезе программирования. Что до переводов, то переводить при помощи ИИ проще, но тоже не полезно. Существует правило 10 000 часов, согласно которому кол-во однажды переходит в качество. Для переводчика оно означает, что после определённой массы текста, вариант перевода формируется в голове автоматически и очень быстро, без долгого перебора вариантов. После интенсивного перевода с ИИ, этот автоматизм атрофируется за ненадобностью и скорость самостоятельного перевода падает.
|
|
|
Anahitta 
 гранд-мастер
      
|
28 января 07:14 [нажмите здесь чтобы увидеть текст поста]
|
цитата SupeR_StaRДля переводчика оно означает, что после определённой массы текста, вариант перевода формируется в голове автоматически и очень быстро, без долгого перебора вариантов. Так и есть. Если текст несложный, то скорость перевода ограничивается только скоростью набора на клавиатуре. Это быстрее, чем переписывать редактировать гугловский или нейросетевой. Да, кое-кто с ИИ книгу за сутки переводит, но о каком редактировании тут может идти речь, если за сутки чисто физически такой объем невозможно даже просто прочитать?
|
––– Чернила соблазнительны. Они имеют нечто общее с вином, чтобы не сказать с кровью. - Петр Вяземский |
|
|
фэйри тэйл 
 активист
      
|
28 января 08:31 [нажмите здесь чтобы увидеть текст поста]
|
Anahitta цитата AnahittaДа, кое-кто с ИИ книгу за сутки переводит, но о каком редактировании тут может идти речь, если за сутки чисто физически такой объем невозможно даже просто прочитать? Вообще, то, у меня процесс редактирования книги, переведенной с ИИ, идет параллельно с ее чтением и занимает чуть больше времени, чем обычное чтение, лишь потому, что читать приходится внимательно и без пропуска слов. Книга в 300-400 страниц переводится без особой спешки за неделю. Сложность возникает лишь в в первых главах, когда надо сформировать матрицу имен и понятий, а дальше надо лишь исправлять опечатки и двусмысленности. Здесь много говорится, что надо обязательно проводить векторный анализ текста и задавать ИИ эмоциональные установки для перевода с помощью хитрых промптов. Но почему все решили, что подобные промпты не были изначально заложены в программу ИИ ее разработчиками? Там ведь тоже работают профессионалы высокого класса! Хочу также присоединиться к благодарностям Anahitta за её перевод Б. Макклеллана. Долгая тщательная работа должна быть отмечена благодарными восторгами читателей!
|
|
|
bor-ka 
 активист
      
|
28 января 08:49 [нажмите здесь чтобы увидеть текст поста]
|
цитата фэйри тэйлНо почему все решили, что подобные промпты не были изначально заложены в программу ИИ ее разработчиками? Там ведь тоже работают профессионалы высокого класса!
Если бы это была специализированная сетка, натренированная на переводы, ну или хотя бы приложение с агентами и системными промтами — то да. Но deepsek, qwen и прочий GLM — это не оно.
А обычные сетки широкого профиля тренируются на другом, про переводы они ничего не знают априори. И в массиве данных из интернета для обучения таких примеров хорошо если единицы. Их основная и единственная задача — правдоподобно продолжать начатый текст, как его продолжил бы человек. Всё.
Поэтому общеязыковые лингвистические конструкции и отчасти общие смысловые — оно "понимает" (насколько можно это слово применить к "Китайской комнате" — но это уже философский вопрос, а не практический про перевод). А вот энциклопедические знания, специальные методики или прочее — ей (сетке) нужно скармливать в промт, примерно как делала SupeR_StaR в своём примере с уточняющими предложениями.
Либо вручную, либо при помощи системных промтов, данных агентов и прочего, с чего я начал выше :)
TL;DR — общеупотребимые модели типа qwen/deepseek/gemini/... — машина по подбору слов в красивом порядке. Оно натренировано на механизмах языка и базовых смыслах. Специальные знания ей надо подавать на вход.
|
|
|
BarDenis 
 активист
      
|
28 января 09:35 [нажмите здесь чтобы увидеть текст поста]
|
цитата SupeR_StaRПопалась на Хабре интересная статья "Навыки, которые вы теряете, пока ИИ берет на себя рутинные задачи". Автор рассматривает вопрос в разрезе программирования. Автор говорит с точки зрения программиста-кодера, и в таком случае он прав. Но я, например, алгоритмист. Мне трудно программировать, так как я плохо помню названия команд и их синтаксис. И дело тут не в практике: я и слова на русском забываю. Поэтому и программирование, и перевод для меня всегда были вызовами, причём не особо интересными. Но с появлением LLM задачи запоминания слов и синтаксиса они взяли на себя. А вот алгоритмы теперь мои. И я вновь вернулся к программированию и занялся переводом. Такое чувство, как будто человеку с ДЦП дали нейронные манипуляторы.
|
|
|
BarDenis 
 активист
      
|
28 января 09:45 [нажмите здесь чтобы увидеть текст поста]
|
цитата bor-kaTL;DR — общеупотребимые модели типа qwen/deepseek/gemini/... — машина по подбору слов в красивом порядке. Оно натренировано на механизмах языка и базовых смыслах. Специальные знания ей надо подавать на вход. Это не совсем так. Специальные знания там тоже есть. Только важен контекст. Его модель не всегда может правильно определить. Большинство ошибок, с которыми я сталкивался, были именно из-за этого.
|
|
|
фэйри тэйл 
 активист
      
|
28 января 09:58 [нажмите здесь чтобы увидеть текст поста]
|
цитата bor-kaА обычные сетки широкого профиля тренируются на другом, про переводы они ничего не знают априори. Насчет Дипсика я не согласен. Этот ИИ определяет жанр переводимого отрывка текста произведения и его эмоциональную окраску без всякого намека с моей стороны. Даже по его комментариям заметно, как он оценивает напряженность сюжета и его эмоциональную подоплеку. Загрузите несколько страниц из электронной книги, не указывая ее происхождения, и попросите перевести как литературный текст — сами в этом убедитесь. И еще надо различать Дипсик лета прошлого года и Дипсик после декабря — совсем разный качественный уровень перевода. Говорю это как постоянный пользователь этой программы с марта 2025 г.
|
|
|