Типова Олена та інші стандарти

За що програмісти і розробники особливо цінують кроликів, драконів і шведську модель Playboy Лену Седерберг.

Від моделей Playboy до китайських драконів: найвідоміші тестові об'єкти в програмуванні, 3D-моделюванні, стисненні та безпеці.



Спортивні змагання допомагають знайти тих, хто швидше, вище, сильніше інших людей. Атлети намагаються першими пробігти потрібну дистанцію, перестрибнути найвищий бар'єр, підняти найважчу штангу. Такі випробування існують і для комп'ютерів - стандартні тестові моделі і файли, на яких програмісти перевіряють працездатність своїх алгоритмів.

Стандартна Олена

Розробники, які створювали перші алгоритми обробки зображень, регулярно брали відповідні картинки, які першими потрапляли їм під руку. Навряд чи дивно, що серед них регулярно траплялися номери журналу Playboy. Перший задокументований випадок такого використання належить до плейбів-моделі Тедді Сміт, знімки якої фігурували в роботі з дизерінгу зображень 1961 р. Але найзнаменитішою з таких картинок виявилася фотографія шведської моделі Олени Седерберг, опублікована в Playboy в 1972 р. і вже наступного року використана Олександром Савчуком, тоді - професором Університету Південної Каліфорнії.

До кінця XX ст. Лена стала одним з найпоширеніших зображень на сторінках професійної преси, в одному номері авторитетного журналу IEEE Transactions on Image Processing за 1999 р. вона з'являлася відразу три рази. Успіх картинки пов'язують не стільки з привабливістю моделі, скільки з вдалим поєднанням характеристик: безлічі тонких деталей, складних ліній, півтонів, тіней дозволяє краще відстежувати те, що відбувається при обробці зображення.

Кролик і дракон зі Стенфорда


З розвитком технологій тривимірного друку свої тестові моделі потрібні для 3D-принтерів і сканерів. Найпопулярнішою з них виявилася об'ємна фігурка кролика, розроблена стенфордськими вченими Грегом Тарком (Greg Turk) і Марком Левоєм (Marc Levoy) в середині 1990-х. Модель була отримана скануванням реальної сувенірної фігурки і складається з 69451 полігонів, зручних для перевірки методів згладжування і стиснення.

Більш складний варіант був створений в тому ж університеті кілька років потому: відсканована фігурка «стенфордського дракона» перетворена на модель, що складається вже з більш ніж 871 полігонів. Крім того, дракон містить дірку в районі вигнутого хвоста - її наявність дозволяє перевіряти роботу з 3D-моделями, поверхня яких не є топологічно зв'язковою, що може ускладнювати застосування деяких технологій.

Калгарійський корпус


Набір коротких цифрових файлів різних форматів вже чверть століття використовується для оцінки роботи алгоритмів стиснення. Наскільки відомо, вперше він з'явився на змаганнях таких програм, які відомий розробник Леонід Брукіс (Leonid Broukhis) влаштовував починаючи з 1996 р. Останнє з них відбулося в 2016-му, і переможці отримали символічні грошові призи - по долару за кожні 111 байт, на які вдалося зменшити обсяг «Карларійського корпусу» (Calgary Corpus).


Стандартний набір містить 14 файлів загальним обсягом 3141622 байт: тексти в різних кодуваннях, фрагменти програмного коду, виконувані файли, зображення тощо. Порівнюючи обсяги отриманих архівів, можна показати, наприклад, що алгоритми gzip 1.3.5 стискають їх до 1916624 байт, а 7-zip 9.12b - до 848687 байт. Поточний рекорд був встановлений на конкурсі в 2010 р. і становить 580170 байт.

Тривожний файл EICAR

Ethical Hacking, Malware Analysis, Disinfection Techniques and more


Результатом спільної роботи експертів Організації з комп'ютерних антивірусних досліджень (CARO) і Європейського інституту вивчення комп'ютерних антивірусів (EICAR) став всього один рядок коду EICAR-Test-File. Це невеликий набір ASCII-символів, які можна ввести прямо з клавіатури і зберегти у вигляді виконуваного COM-файлу. Ось його текст: «X5O!P%@AP[4\PZX54(P^)7CC)7}$EICAR-STANDARD-ANTIVIRUS-TEST-FILE!$H+H*».

EICAR-Test-File призначений для швидкої перевірки працездатності антивірусного захисту комп'ютера. Сам по собі він абсолютно нешкідливий, але в нормі повинен блокуватися резидентним антивірусним моніторингом з видачею відповідного повідомлення - наприклад, «EICAR Test-NOT virus!!!» у антивірусу Avast, - а може викликати тривогу ще при спробі зберегти файл. Програма працює тільки в 16- і 32-бітових операційних системах на базі DOS Windows NT.

Гарвардські фразочки

Колекція коротких пропозицій Harvard sentences використовується для перевірки якості голосового зв'язку, включаючи стільникову і VoIP-телефонію. Вони застосовуються вже понад півстоліття і вперше були складені гарвардськими лінгвістами ще в 1965-му: «The Navy attacked the big task force», «See the cat glaring at the scared mouse» и т.д. Фонетично збалансовані, ці фрази дозволяють оцінити роботу всіх систем, пов'язаних з передачею звуку і в сучасних цифрових форматах.

Для цих цілей сотні відповідних пропозицій були розділені на 72 списки по 10 штук, на вибір користувача. Сьогодні багато з них доступні у вигляді вже готові WAV-файлів у відкритій бібліотеці Open Speech Repository, проговорених добре поставленим англійським, чоловічим і жіночим голосами.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND