На Хабре периодически появляются разгромные статьи на тему, какой нынче Хабр стал «плохой», «злой», «корпоративный». О том, что он совсем «не тот, что прежде», «скатился» и вообще «пробил дно». Вы, наверное, также помните проникновенные посты в духе «Прощай, Хабр». Многие хорошие люди покинули сайт, и на то были веские основания.
Рубрика «авторство текстов»
Чудесное совпадение или плагиат в квадрате? Хабр, ну как же так!?
2024-09-08 в 14:03, admin, рубрики: авторство текстов, авторы хабра, воровство контента, контент, переводы, плагиат, плагиат в квадрате, статьи, хабрПрограмма на PYTHON для определения авторства текста по частоте появления новых слов
2017-03-04 в 12:18, admin, рубрики: python, авторство текстов, закон ЗипфаКороткая история метода
В короткой публикации [1] под названием “Авторство писателей можно узнать по специальной формуле” сообщалось, что в научном издании «New Journal of Physics», группа шведских физиков из университета Умео под руководством Себастьяна Бернгардсона описала новый метод, который позволяет на основе статистических данных определить автора текста. Исследователи проверяли, как в текстах трех писателей — Томаса Харди, Генри Мелвилла и Дэвида Лоуренса — реализуется так называемый закон Ципфа. Исследователи обнаружили, что частота появления новых слов по мере роста объема текста меняется у разных авторов по-разному, причем эта закономерность не зависит от конкретного текста, а только от автора.
Это сообщение было опубликовано 11.12.2009, а, более двадцати лет тому назад, Джон Чарльз Бейкер [2] ввел единицу для измерения способности автора использовать новые слова (здесь понятие «новые» трактуется как ранее не используемые в данном тексте). Джон доказал, что указанная единица является индивидуальной характеристикой автора.
В периодических изданиях и в сети отсутствует информация о реализации закона Зипфа для определения авторства. Поэтому моя работа является первым научным исследованием в указанной области.
Читать полностью »