dev График со статистикой ...


Вы здесь: Форумы fantlab.ru > Форум «Техподдержка и развитие сайта» > Тема «[dev] График со статистикой работ автора (beta)»

[dev] График со статистикой работ автора (beta)

 автор  сообщение


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 20:19  

цитата Semenych

Ну я пытался ответить на вопрос, что издатели больше всего склонны печатать и соотв что они считают более популярным (при прочих равных). Грубо говоря мера популярности книги.

Но постойте, причём тут мера популярности книги??? Автор выпустил в 1950 году 17 рассказов, вы их тиражи просуммировали и показали сумму на графике. При этом популярен только один, а шестнадцать забыты и издавались один раз. Как по графику эту популярность вообще можно увидеть?


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 20:22  
И следствие из предыдущего вопроса: если вы хотите определять популярность, то не логичнее ли показать график изданий по годам издания? Он имеет осмысленное значение — мы видим сразу, в какие годы автора больше печатали. Видим популярность автора у издателя. При той картинке, как сейчас сделана, мы этого увидеть не можем.


философ

Ссылка на сообщение 20 ноября 2016 г. 20:22  

цитата Dark Andrew

2. Потому что у вас роман в периодике может издаваться 12 номеров журнала, а вы каждый посчитаете за отдельное издание

Ага! Интересный момент, про журналы я как-то не подумал. А можете привести пример какого-то романа издававшегося журналами и видимого тут на фанталабе — хочу посмотреть как это выглядит на практике


философ

Ссылка на сообщение 20 ноября 2016 г. 20:23  

цитата Dark Andrew

Но постойте, причём тут мера популярности книги??? Автор выпустил в 1950 году 17 рассказов, вы их тиражи просуммировали и показали сумму на графике. При этом популярен только один, а шестнадцать забыты и издавались один раз. Как по графику эту популярность вообще можно увидеть?

Там если в детали кликнуть все видно. График не ответ а скорее указание где искать


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 20:29  

цитата Semenych

Там если в детали кликнуть все видно. График не ответ а скорее указание где искать

Так я же и показываю, что не даёт. Как вы сможете найти популярное произведение по графику? Вот давайте на примере Шекли — "количество изданий работ года". Самое большое по графику значение 1953 год. Он показывает безумную цифру 398 рассказов (что бы это ни значило). Открываем — и получаем популярные рассказы, среди прочих, но вовсе не самые публикуемые.

В 1959 есть "Особый старательский", чьи тиражи выше, чем у любого рассказа 1953 года и из графика мы никогда этого не узнаем.

За счёт суммирования тиражей разных произведений одного года популярность конкретного исчезает и найти его становится возможным только кликанием по всем по очереди столбикам.


философ

Ссылка на сообщение 20 ноября 2016 г. 20:47  

цитата Dark Andrew

За счёт суммирования тиражей разных произведений одного года популярность конкретного исчезает и найти его становится возможным только кликанием по всем по очереди столбикам.

или за счет другого инструмента :-)


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 20:55  

цитата Semenych

или за счет другого инструмента

И что это за инструмент? И, что важнее, а в чём тогда смысл в графике? Чтобы просто был?

Мне всегда казалось, что сначала ставится цель получить то и вот то, а потом делается что-то. Так какая цель была у этих графиков с изданиями и тиражами? Потому что пока те цели, о которых ты пишешь, не достигнуты, как можно легко убедиться на примерах.

Объясни, пожалуйста, как этими графиками можно осмысленно пользоваться? Какие сценарии работы с ними предполагались при их создании в таком виде, как они сделаны сейчас?


миродержец

Ссылка на сообщение 20 ноября 2016 г. 21:57  
Любопытная статистика. Правда, пока плохо понимаю, что она нам даёт.
–––
На сайте набегами, в лучшем случае.


миродержец

Ссылка на сообщение 20 ноября 2016 г. 21:58  

цитата Dark Andrew

Нужно выделить русскоязычные издания.

Да я всего лишь пытаюсь обратить внимание, что "отделение русскоязычных изданий от изданий не на русском языке" — это совершенно не то же самое, что "разделить кол-во изданий на языке оригинала и кол-во изданий на русском", как было сформулировано. Тщательней бы надо.

цитата Dark Andrew

про сумму российских и иностранных изданий

Вот ещё один пример неаккуратной формулировки, которая всё только запутывает. Что такое российский издания и что такое иностранные издания?
Например, первые — издания российский издательств? Но российские издательства издают книги не только на русском языке, но и на всяческих других. И вдобавок не только на разных там английских/немецких/французских (то есть как бы иностранных), но и на татарском/башкирском/якутском/... (первые два даже внесены в список доступных языков изданий Фантлаба). Или первые — это издания на русском языке? Но на книга на русском запросто может оказаться быть изданной не в России, причём не только в Белоруссии/Казахстане, но и в Израиле или Китае.
Аналогично с термином "иностранное издание". Если это выпущенное не в России, то сколько там сотен тысяч экземпляров на русском издано на Украине? А если это издание на любом языке, кроме русского, то книги на башкирском и татарском становятся вдруг "иностранными".

Но помимо этих вот терминологические ньюансов в целом я согласен, что надо бы сначала было определиться, что и зачем показывать графиками.
–––
«Не могли бы вы угостить крекером моего дроматерия?»


миротворец

Ссылка на сообщение 20 ноября 2016 г. 22:18  
Спасибо, очень интересный-полезный инструмент...
–––
Helen M., VoS


миродержец

Ссылка на сообщение 20 ноября 2016 г. 22:18  

цитата Semenych

данные об изданиях на не русском языке сильно менее точны чем на русском

В первую очередь они сильно менее полны. Но и сильно менее точны, конечно, тоже.
–––
a million bright ambassadors of morning


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 22:31  

цитата Zlogorek

Да я всего лишь пытаюсь обратить внимание, что "отделение русскоязычных изданий от изданий не на русском языке" — это совершенно не то же самое, что "разделить кол-во изданий на языке оригинала и кол-во изданий на русском", как было сформулировано. Тщательней бы надо.

Ну так всё верно. Если по уму делать то нужно выделить:
— на языке оригинала
— на русском
и можно выбросить всё остальное.

цитата Zlogorek

Вот ещё один пример неаккуратной формулировки, которая всё только запутывает.

Ну если вязаться к словам, то да. Но внутри базы нет русских и иностранных изданий, а есть издания на русском и на иностранных языках. Программиста работающего с базой никак моя формулировка не может запутать.


миродержец

Ссылка на сообщение 20 ноября 2016 г. 22:41  

цитата Semenych

цифра за 2011 год это не издания в 2011 году, а издания (включая более поздние) произведений созданных в 2011 году

А вот это, действительно, во-вторых, не понятно, а во-первых, вообще неправильно. Как определяется год создания? По году первого издания? Но это в базе год книжной публикации, а произведение могло быть ранее напечатано в периодике, о чём в лучшем случае написано в примечании на странице произведения. Год написания (то есть именно создания) отдельно проставлен только в случае, если он достоверно известен.

цитата Semenych

про журналы я как-то не подумал. А можете привести пример какого-то романа издававшегося журналами и видимого тут на фанталабе — хочу посмотреть как это выглядит на практике

Я могу — Эдгар Райс Берроуз "Тарзан и люди-муравьи" сначала публиковался в журнале «Argosy All-Story Weekly», в 7 (семи) выпусках. И только потом был издан как книга.
Повесть Кир Булычева "Лиловый шар" — впервые была опубликована в газете "Пионерская правда" на протяжении кучи номеров.
Юлиан Семёнов "Экспансия-I" — в журнале "Знамя" 4 номера в 1985 г., в "Роман-газете" 2 номера в 1986 г., в авторском сборнике в 1986 г.
Ольга Ларионова "Чакра Кентавра" — журнал "Уральский следопыт" 4 номера в 1988, в антологии (т.е. не в авторской книге или авторском сборнике) в 1988 и 1991, в авторских сборниках.

цитата Semenych

В чем смысл только на родном языке трекать? По идее тут есть артефакт не полноты данных фантлаба — не все издания есть и не для всех есть тираж т.е. для русских изданий тираж выше.

Для иностранных изданий данных о тиражах нет не потому, что они внесены как-то неправильно/неполно, а потому что во многих странах тиражи не указываются в принципе. Нигде и никак.
–––
«Не могли бы вы угостить крекером моего дроматерия?»


миродержец

Ссылка на сообщение 20 ноября 2016 г. 23:02  

цитата Dark Andrew

Но внутри базы нет русских и иностранных изданий, а есть издания на русском и на иностранных языках.

Опять придётся привязаться к словам. :( Но и изданий на иностранных языках в базе нет тоже. Понятие и атрибут "иностранности" не определён и не назначен.
Есть, например, российские издания на башкирском и на татарском, это не иностранные языки, это государственные наряду с русским.
Есть советские издания на эстонском, литовском, украинском, белорусском, ... Тогда они не были иностранными, даже сейчас непонятно, называть ли их иностранными, тот же украинский имеет статус государственного.
То есть для "программиста работающего с базой" нет никаких иностранных языков вообще, он не в состоянии это определить. Максимум о чём можно говорить, что есть русский как официальный язык Фантлаба и есть все остальные.
–––
«Не могли бы вы угостить крекером моего дроматерия?»


гранд-мастер

Ссылка на сообщение 20 ноября 2016 г. 23:06  
Zlogorek
Для программистов есть только одно поле издания, которое здесь подходит — язык. Зайдите в редактирование издания и посмотрите на него. По этому полю и нужно ориентироваться. У нас есть русский и есть все остальные, считающиеся иностранными. Не нужно усложнять простое.


миродержец

Ссылка на сообщение 21 ноября 2016 г. 13:15  

цитата Dark Andrew

Если по уму делать то нужно выделить:
— на языке оригинала
— на русском
и можно выбросить всё остальное.

Извините, что вклиниваюсь, но отделить издания на языке оригинала от изданий на других иностранных языках технически невозможно. Программе неоткуда узнать, на каком языке пишет автор, если он не русскоязычный.

цитата Dark Andrew

У нас есть русский и есть все остальные, считающиеся иностранными.
–––
На сайте набегами, в лучшем случае.


миродержец

Ссылка на сообщение 21 ноября 2016 г. 13:30  

цитата Semenych

А среднюю как (midmark1+midmark2+ ... + midmarkN) /N где 1..N это произведения

Для начала меня бы устроил и такой вариант:)

цитата Semenych

"Средняя оценка по типам произведений"?

Почему бы и нет?
–––
Следующие рецензии в АК:
~~stay tuned~~


философ

Ссылка на сообщение 21 ноября 2016 г. 14:40  

цитата Green_Bear

Почему бы и нет?
Ну тут отдельные товарищи ударяются в перфекционизм. С точки зрения перфекционизма — предположим у нас есть год где автор написал три рассказал у одного рейтинг 10 и 1000 оценок, у второго рейтинг 8 и 1 оценка (ну не публиковался он). у третьего рейтинг 6 одна оценка (вообще плохой рассказ). Тогда (10+8+6)/3 = 8 — а если посчитать по всем оценкам то будет почти 10.

PS: Но вообеще по мне так и нормально. Описанная ситуация не вполне типична и в большинстве случаев будет вполне осмысленная оценка.


миродержец

Ссылка на сообщение 21 ноября 2016 г. 14:42  

цитата Semenych

С точки зрения перфекционизма — предположим у нас есть год где автор написал три рассказал у одного рейтинг 10 и 1000 оценок, у второго рейтинг 8 и 1 оценка (ну не публиковался он). у третьего рейтинг 6 одна оценка (вообще плохой рассказ). Тогда (10+8+6)/3 = 8 — а если посчитать по всем оценкам то будет почти 10.

Мне кажется, что сперва вполне разумно сделать "рыбу", "шаблон", а потом уже кропотливо дорабатывать и расширять.

Да, в ряде случаев средняя оценка посчитается с перекосом, но сейчас я ее вообще не могу увидеть:) Разве что считать вручную, что далеко не айс.
–––
Следующие рецензии в АК:
~~stay tuned~~


философ

Ссылка на сообщение 21 ноября 2016 г. 15:04  

цитата Green_Bear

Мне кажется, что сперва вполне разумно сделать "рыбу", "шаблон", а потом уже кропотливо дорабатывать и расширять.

Да, в ряде случаев средняя оценка посчитается с перекосом, но сейчас я ее вообще не могу увидеть:) Разве что считать вручную, что далеко не айс.

(have five) исключительно согласен
Страницы: 12    🔍 поиск

Вы здесь: Форумы fantlab.ru > Форум «Техподдержка и развитие сайта» > Тема «[dev] График со статистикой работ автора (beta)»

 
  Новое сообщение по теме «[dev] График со статистикой работ автора (beta)»
Инструменты   
Сообщение:
 

Внимание! Чтобы общаться на форуме, Вам нужно пройти авторизацию:

   Авторизация

логин:
пароль:
регистрация | забыли пароль?



⇑ Наверх