Рубрика «форматы файлов»

Непричёсанные мысли по поводу формата сохранения: теория

2020-01-13 в 3:22, admin, рубрики: никто не читает теги, Проектирование и рефакторинг, сохранение в файл, форматы файлов, хранение данных

Непричёсанные мысли по поводу формата сохранения: теория - 1

Начнём с вводных. Мы разрабатываем программу, которая будет сохранять свои данные в файл, и при этом…

будет расширяться, и существенно (отпадают уровни и сохранения большинства игр: после пары патчей бросаем игру и пишем новую);
тем не менее программа не рассчитывает на то, чтобы быть стандартом (отпадает LibreOffice). То есть по формату сохранения она должна быть совместима только с собой-старой и собой-новой;
все её данные надо держать одномоментно в памяти; СУБД типа SQLite не даёт каких-то преимуществ (отпадают базы переписки в почте или мессенджере);
но файл сохранения будет очень велик (отпадают программы фотопроявки вроде Lightroom, где документ — это всего лишь положения сотни-другой ползунков: мелочь по сравнению с 40-мегабайтным RAW);
нет нужды в ручной корректировке файлов (отпадает пользовательский интерфейс типа «файл конфигурации», присущий, например, серверу Apache).

Таких программ на самом деле немало. Это AutoCAD, Photoshop, Microsoft Office (будем честными: даже пытаясь протащить его через ISO, «мелкомягкие» рассчитывали, что он будет совместим в первую очередь с самим собой).

И для простоты добавим ещё одно требование, которое отбросит все три этих программы, но довольно реалистичное (ему отвечают Windows 10 и куча программ помельче).

программа разрабатывается по непрерывной схеме, так что нет денежных барьеров обновляться, а достаточно старые версии программы по факту неподдерживаемые.Читать полностью »

Новое в Hadoop: познакомимся с различными форматами файлов в Hadoop

2019-08-26 в 16:59, admin, рубрики: big data, Column-oriented, Hadoop, Map-файл, ORC-файл, ORCFile, parquet, RC-файл, RCFile, Row-oriented, Sequence-файл, Блог компании OTUS. Онлайн-образование, форматы файлов

Всем привет! Публикуем перевод статьи, подготовленный для студентов новой группы курса «Data Engineer». Если интересно узнать, как построить эффективную и масштабируемую систему обработки данных с минимальными затратами, посмотрите запись мастер-класса Егора Матешука!

Новое в Hadoop: познакомимся с различными форматами файлов в Hadoop - 1

Несколько недель назад я написал о Hadoop статью, где осветил различные его
части и разобрался в том, какую роль он играет в области data engineering. В этой статье я
дам краткое описание различных файловых форматов в Hadoop. Это быстрая и легкая
тема. Если вы пытаетесь понять, как работает Hadoop и какое место он занимает в работе
Data Engineer, ознакомьтесь с моей статье о Hadoop здесь.Читать полностью »

«Камень я не дам» или как устроены ресурсы игры «Проклятые Земли»

2018-12-29 в 14:07, admin, рубрики: разработка игр, реверс-инжиниринг, старые игры, форматы файлов

«Камень я не дам» или как устроены ресурсы игры «Проклятые Земли» - 1

Много ли вы вспомните российских игр? Качественных? Запоминающихся? Да, такие были. Если вам больше 35 или вы фанат российского игропрома, то с "Проклятыми Землями" вы наверняка знакомы.

История начиналась весьма прозаично: лето, жара. Делать особо нечего, а при ленивом просмотре содержимого жёсткого диска ноутбука взгляд зацепился за папку со знакомой иконкой-дракончиком, лежащую без дела уже пару лет.

Какому фанату игры не будет интересно узнать, что же там внутри?

Читать полностью »

FLIF – идеальный формат для изображений?

2017-03-27 в 13:00, admin, рубрики: FLIF, GPL, jpeg, open source, PNG, WebP, арифметическое кодирование, Блог компании WEBO Group, графические файлы, Клиентская оптимизация, обработка изображений, Разработка веб-сайтов, сжатие данных, сжатие изображений, форматы файлов

Как формат JPEG произвел в свое время революцию среди форматов изображений, так и новый формат FLIF обещает такого же масштаба событие для дизайнеров и веб-разработчиков.

FLIF (Free Lossless Image Format) – новый формат файлов для изображений, обеспечивающий беспрецедентное сжатие без потерь. Файлы получаются:

На 14% меньше, чем WebP, без потерь
На 22% меньше, чем BPG, без потерь
На 33% меньше, чем сжатый через ZopfliPNG PNG-файл
На 43% меньше, чем обычные PNG-файлы
На 46% меньше, чем оптимизированные по Adam7 чересстрочные PNG-файлы
На 53% меньше, чем JPEG 2000, без потерь
На 74% меньше, чем JPEG XR, без потерь

На Хабре уже опубликовано пару статей на тему FLIF. Но мы пойдем дальше: какую еще практическую пользу несет формат, кроме меньшего размера для любого типа изображений?
Читать полностью »

Еще одна новая фича pg_filedump: восстанавливаем каталог PostgreSQL

2017-03-10 в 13:20, admin, рубрики: C, postgresql, базы данных, Блог компании Postgres Professional, Восстановление данных, Форматы данных, форматы файлов

Еще одна новая фича pg_filedump: восстанавливаем каталог PostgreSQL - 1

В прошлой статье мы узнали, как при помощи утилиты pg_filedump можно восстановить данные, или, по крайней мере, какую-то их часть, из полностью убитой базы PostgreSQL. При этом предполагалось, что мы откуда-то знаем номера сегментов, соответствующих таблице. Если мы знаем часть содержимого таблицы, ее сегменты действительно не сложно найти, например, простым grep'ом. Однако в более общем случае это не так-то просто сделать. К тому же, предполагалось, что мы знаем точную схему таблиц, что тоже далеко не факт. Так вот, недавно мы с коллегами сделали новый патч для pg_filedump, позволяющий решить названные проблемы.

Читать полностью »

Пример восстановления таблиц PostgreSQL с помощью новой мега фичи pg_filedump

2017-01-18 в 14:02, admin, рубрики: C, postgresql, базы данных, Блог компании Postgres Professional, Восстановление данных, Форматы данных, форматы файлов

Пример восстановления таблиц PostgreSQL с помощью новой мега фичи pg_filedump - 1

Позвольте я расскажу вам об одной классной фиче, которую мы с коллегами из Postgres Pro недавно запилили в утилите pg_filedump. Фича эта позволяет частично восстанавливать данные из базы, даже в случае, если база была сильно повреждена и инстанс PostgreSQL с такой базой уже не запустишь. Конечно, хочется верить, что потребность в таком функционале возникает крайне редко. Но на всякий случай нечто подобное хотелось бы иметь под рукой. Читайте дальше, и вы узнаете, как данная фича выглядит в действии. Читать полностью »

Почему форматы файлов Microsoft Office такие сложные?

2016-09-12 в 17:21, admin, рубрики: Excel, microsoft, microsoft office, word, бинарные файлы, История ИТ, форматы файлов

Статья от 19 февраля 2008 года

На прошлой неделе Microsoft опубликовала спецификации форматов бинарных файлов для Office. Эти форматы выглядят безумно. Формат файла Excel 97-2003 представляет собой 349-страничный файл PDF. И это ещё не всё! В документе содержится такой комментарий:

Каждый лист [workbook] в Excel хранится в составном файле.

Видите ли, файлы Excel 97-2003 – это составные документы OLE, которые в свою очередь представляют собой некое подобие файловой системы в одном файле. Чтобы в этом разобраться, нужно прочитать 9 страниц документации. А сами спецификации больше похоже на структуры данных в С, чем на то, что мы привыкли называть спецификациями. Это иерархическая система файлов.

Если вы подумали, что почитаете эти форматы и за выходные набросаете утилитку для экспорта вордовских документов в свой блог, или создающую экселевские таблички на основе ваших персональных финансовых данных, то сложность и длина этих спецификаций должны были отбить у вас всю охоту. Нормальный программист решит, что формат бинарников из Office:

сделан запутанным специально
придуман каким-то страдающим от старческого маразма представителем кибернетической расы боргов
создан безумно плохими программистами
не может быть правильно создан или прочитан

Читать полностью »

Один пиксель вместо тысячи слов

2016-07-22 в 8:38, admin, рубрики: gif, jpg, PNG, графические файлы, ненормальное программирование, обработка изображений, Разработка веб-сайтов, сжатие данных, форматы файлов

Один пиксель вместо тысячи слов - 1

Пару месяцев назад, отдыхая от реализации новых возможностей вроде q_auto и g_auto, я прикалывался в нашем командном чате по поводу того, как различные форматы хранения изображений будут сжимать однопиксельную картинку. В ответ Orly, редактор блога, попросил меня написать пост об этом. Я сказал: «Конечно, почему бы и нет. Но это будет очень короткий пост. Ведь что можно рассказать про один пиксель».

Похоже, я был сильно неправ.

Что можно сделать с одним пикселем?

В ранние годы веба однопиксельные картинки часто использовались как костыли для вещей, которые сейчас делаются через CSS. Создание отступов, линий, прямоугольников, полупрозрачных фонов – много чего можно сделать, просто масштабируя пиксель до нужных размеров. Ещё одно использование пикселей, дожившее до наших дней – маячки, средства для отслеживания и аналитики.

В отзывчивом веб-дизайне однопиксельные картинки используются как временные заглушки в ожидании загрузки страницы. Большинство браузеров не поддерживают HTTP Client Hints, поэтому некоторые варианты с отзывчивыми изображениями ждут полной загрузки страницы, чтобы подсчитать актуальный размер картинок, а затем заменяют однопиксельные картинки нужными изображениями при помощи JavaScript.

Один пиксель вместо тысячи слов - 2
Сломанная картинка
Читать полностью »

Нужна ли замена JSON? По следам статьи про KTV

2016-03-09 в 6:37, admin, рубрики: json, ktv, s2, разработка мобильных приложений, разработка под iOS, форматы передачи данных, форматы файлов, метки: ktv

Я, в целом, планировал публикацию про KTV для ссылки из других статей, чтобы, когда я их опубликую (например, вот эта, про S2) — можно было сослаться и не было бы вопросов, что такое KTV, и откуда оно возникло. Но тема оказалась больная. Поэтому я решил, что нужно немного подробнее рассказать, откуда возникла такая, странная на первый взгляд, идея.

Прикладываю к статье опросы. Помогите мне, пожалуйста, разобраться, в ситуации. :-)
Читать полностью »

KTV. Новый JSON

2016-03-08 в 9:01, admin, рубрики: json, ktv, парсер json, парсинг json, парсинг объектов, разработка мобильных приложений, разработка под iOS, форматы файлов

В своём развитии мне пришлось пробежаться по нескольким этапам в нескольких направлениях: Java → Objective C → Swift, Web → Enterprise → Mobile, XML → JSON. Этим путём я шёл на протяжении более 15 лет, подолгу и внимательно задерживаясь на каждом этапе. Нужно идти дальше. За мобильными приложениями можно придумать что-то (наверное, пока не хочется), языков вообще пруд-пруди, ничего интереснее JSON'а не придумали. А зачем его менять?

Дальше я расскажу почему мне не очень нравится JSON для некоторых применений и как, по моему мнению, его можно доработать, чтобы стало немного удобнее.

Сразу должен отметить, что не рассматриваю KTV, как замену JSON. И ни в коем случае не рассматриваю его для использования в JavaScript'е. Это будет неудобно и неправильно. С другой стороны, ситуация, когда система описания объектов JavaScript'а используется в других языках для работы с типизированными данными — тоже странная, и её хочется поправить.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «форматы файлов»

Непричёсанные мысли по поводу формата сохранения: теория

Новое в Hadoop: познакомимся с различными форматами файлов в Hadoop

«Камень я не дам» или как устроены ресурсы игры «Проклятые Земли»

FLIF – идеальный формат для изображений?

Еще одна новая фича pg_filedump: восстанавливаем каталог PostgreSQL

Пример восстановления таблиц PostgreSQL с помощью новой мега фичи pg_filedump

Почему форматы файлов Microsoft Office такие сложные?

Один пиксель вместо тысячи слов

Что можно сделать с одним пикселем?

Нужна ли замена JSON? По следам статьи про KTV

KTV. Новый JSON

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «форматы файлов»

Что можно сделать с одним пикселем?

Новости

Актуальные темы

Архив