Рубрика «imdb»

Почему СУБД такие медленные - 1

Недавно на Хабре публиковался перевод статьи «Просто выберите Postgres» (оригинал, англ. яз) с аргументами, что Postgres — оптимальная БД для десктопных и мобильных приложений. Аналогичное мнение высказывают в других популярных статьях вроде «До свидания MongoDB, здравствуй PostgreSQL». Главным недостатком SQLite называют то, что данные хранятся в одном файле, а MongoDB (а также DynamoDB и Cassandra) — низкую производительность:

«Всё это связано с тем, что подобные базы данных, по сути, представляют собой огромную распределённую хеш-таблицу. Единственные операции, работающие без необходимости сканирования всей базы данных — это поиск по секционному ключу и сканы, при которых используется ключ сортировки.

…Если паттерны доступа существенно изменятся, то может потребоваться полная повторная обработка всех данных».

Более производительные резидентные БД хранят данные в памяти (Redis, Valkey), но их использование ограничено объёмом ОЗУ.

После такого заявления интересно посмотреть на независимые тесты производительности разных СУБД.Читать полностью »

На прошлой неделе Джефф Безос, глава Amazon, стал самым богатым человеком в мире, а стоимость его компании превысила $500 млрд. Активы бизнесмена достигли отметки в $91,4 миллиарда – при том, что в марте этого года у него было «всего» $70 млрд, и он не входил даже в первую тройку. Теперь у Джеффа Безоса с Биллом Гейтсом намечается игра «Перетягивание каната». Разница между их состояниями меньше $1 млрд, и в рейтинге Forbes они будут сменять друг друга, в зависимости от колебания акций Microsoft и Amazon. Первое место Гейтс точно не удержит: у него нет цели увеличить свой капитал, он занят благотворительностью, а вот мистер Безос развивает свое детище в полную силу, благодаря правильному использованию big data. У американских предпринимателей по поводу его работы возникают серьезные опасения.

В мае, еще до нового раунда роста акций Amazon, много шума в США наделал исследование о том, как компания «съест весь мир». Выводы там такие: конкурировать с ценами ритейлера невозможно. Лучший анализ big data позволяет магазину держать всех своих конкурентов в узде, и все другие крупные продавцы на американском рынке просто постепенно уйдут с дистанции. Единственная компания, которая может остановить полную монополизацию всех интернет-продаж – это (многим ненавистный) Walmart. Бандеролька считает доходы и разбирается в бизнес-империи Джеффа Безоса →

Джефф Безос стал самым богатым человеком планеты. Почему Amazon «съест весь мир» - 1

Читать полностью »

Исследование датасета с IMDB - 1

Проблематика

Фильмы — это круто, фильмы вдохновляют нас, наполняют уверенностью, в общем дают нам многое. И поэтому в этой статье я бы хотел рассказать вам об исследовании тенденций современного кинематографа с помощью инструментов анализа данных, который уже был презентован в финале Science Slam ITMO University 2.0. Полный выпуск доступен здесь.
Читать полностью »

3 февраля в Амстердаме стартует очередной фестиваль “Bitcoin Wednesday”, организаторы которого уже два года подряд регулярно демонстрируют зрителям фильмы о биткоине. Однако биткоин интересует уже не только преданных фанатов, гиков и предпринимателей. Миллионы людей ежедневно используют биткоин и блокчейн для совершения крупных и мелких транзакций, заключения контрактов и сделок. Как оказалось, волна общественного признания и интереса к криптовалюте способна увлечь за собой даже китов из мира массовой киноиндустрии. Интерес, проявляемый к криптовалюте в Голливуде, является ценным свидетельством выхода биткоина в мэйнстрим.

Кино и криптовалюты или В главных ролях: биткоин - 1
Читать полностью »

Инструкция для «чайников»: перенос оценок фильмов с КиноПоиска на IMDB - 1

Предисловие

Совсем недавно, когда началась эпопея с КиноПоиском, я задумался о переходе на IMDB — в плане переноса туда своих оценок фильмов. И желательно, чтобы это можно было сделать в автоматическом режиме, потому как проставлять вручную заново на IMDB свои 803 оценки фильмов не хотелось.
Читать полностью »

image
Скриншот сайта

Интернет существует уже так давно, что у некоторых сайтов случаются «серебряные» юбилеи. 17 октября исполнилось 25 лет со дня основания Internet Movie Database. Этот любимый киноманами сайт начал свой путь в usenet-группах, и сейчас остаётся самой полной базой данных по фильмам и одним из самых посещаемых интернет-ресурсов в мире.

В 1990-м году всё началось с поста в одну из групп usenet'а «rec.arts.movies» под названием «Ах, эти глаза», в котором программист Колин Нидхэм [Colin Needham] собрал свой списочек из актрис с красивыми глазами. Люди подхватили идею и начали постить свои списки фильмов и актёров, составленные по своим предпочтениям. Постепенно затея начала превращаться в подобие базы данных, где разные люди вели разные списки (список актёров, список режиссёров, и т.п.).

К концу года в списках уже числилось более 10000 фильмов и сериалов, с перекрёстными ссылками на занятых в них актёров и режиссёров. 17 октября 1990 года Нидхэм запостил в группу разработанный им набор скриптов, позволяющий искать информацию в набранных списках. И хотя это был не сайт, и называлась эта коллекция «rec.arts.movies movie database» эту дату принято считать началом деятельности IMDb.
Читать полностью »

Оригинальная статья. Перевод — Interweb Pro.

***

Ничто не вечно , даже единороги. Но некоторые единороги живут долго.

Жизненный цикл потребительских товаров удручающе предсказуем. Продукт становится хитом, потому что находит отклик у поколения. Но с течением времени это поколение взрослеет и неизбежно заменяется новым рядом потребителей с иными вкусами и интересами. Товар, Читать полностью »

Поиск наилучшей последовательности просмотра списка 250 лучших фильмов с помощью языка Wolfram Language (Mathematica) - 1

Скачать перевод в виде документа Mathematica, который содержит весь код использованный в статье, можно здесь (архив, ~76 МБ).

Введение

Некоторое время назад, если быть точным — 515 дней, вышел пост Маттиаса Одисио (Matthias Odisio) под названием “Random and Optimal Mathematica Walks on IMDb’s Top Films” (Случайные и оптимальные блуждания Mathematica по списку 250 лучших фильмов по версии IMDB). В нем рассказывается о том, каким образом можно получить оптимальную последовательность просмотра фильмов из соответствующего списка, основанную на близости жанров фильмов и близости постеров фильмов с точки зрения цвета.
Читать полностью »

IMDB, «Зловещие Мертвецы» и немного Excel В одном обсуждении с подругой фильмов у нас возник вопрос — а действительно ли «Зловещие мертвецы» (фильм 1981 года, а не недавний убогий ремейк ремейка… ремейк в квадрате?) для своего времени был очень дешевым, бюджетным фильмом, как часто упоминается в различных обзорах? Ну а любопытство ведь нужно удовлетворять… В качестве источника данных возьмём сайт IMDB.com, благо там часто можно найти строчку с бюджетом.
Читать полностью »

С давних времен человечество занималось тем, что накапливало информацию, анализировало и хранило её в каком-либо виде, чтобы потом передать потомкам. Эволюция нашего сознания смогла стать возможной во многом благодаря именно этому — новому поколению людей не надо было постигать то, что уже было постигнуто до них. Начиная с древнейших носителей информации – египетских папирусов и шумерских табличек с клинописью, человечество накапливало всё больший и больший объем информации. В истории человечества были времена, когда в результате войн и катаклизмов часть уже накопленных знаний уничтожалась или исчезала, и тогда прогресс останавливался, а человечество отбрасывалось назад в своем развитии. Настоящей революцией и прорывом стало открытие технологии массового книгопечатания, которое позволило распространять информацию на большую аудиторию, что в свою очередь привело к взрывному росту в науках, искусстве, а также вывело сознание всего человечества на более высокий уровень. Развитие технологий в ХХ веке привело к появлению новых носителей информации – перфокарты, перфоленты, жёсткие магнитные диски и т.п. Всё большие и большие объемы информации переносились из гроссбухов на электронные носители. Возникла потребность в организации и управлении доступа к этим данным – так появились первые СУБД.

Реляционная модель данных, предложенная в 1970 году Э.Ф. Коддом, надолго задала тенденцию в развитии баз данных и позволила полностью отвечать требованиям бизнеса до сегодняшнего момента. С 1970 года реляционные базы данных прошли большой путь и приняли много вызовов, встававших на их пути. Постоянно растущие объемы данных привели к появлению методов, способных обеспечить более быстрый доступ к необходимым данным – индексы, хранение данных в отсортированном виде и т.п. Эти методы вполне успешно справлялись со своей задачей, да и до сих пор не потеряли своей актуальности. Однако стремительное увеличение объемов носителей информации и удешевление стоимости хранения данных привело к тому, что объемы баз данных в десятки терабайт не являются уже чем-то необычным и воспринимаются, как обычное явление. Бизнес не может допустить, чтобы эти данные лежали «мертвым грузом», так как всё возрастающая конкуренция в мире заставляет его искать новые подходы к освоению сферы своей деятельности, ведь по крылатому выражению – «Кто владеет информацией, тот владеет миром». Если говорить о времени, то счет идет не на дни, или даже часы, а скорее на минуты – кто сможет быстро получить необходимую информацию, тот и выиграет.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js