Результаты исследования цветов от Рэндела Манро (xkcd)
«Кто, глядя на радугу, способен указать точную границу, где кончаются синие тона и начинаются оранжевые? Мы ясно видим различие цветов, но где всё-таки один сменяет другой? Здесь и начинается безумие»
— Герман Мелвилл, Билли Бадд.
«Оранжевый? Рыжий? Я не знаю, чему больше верить!»
— Аноним, опрос о цветах.
«Бля, я воткну тебе вилку в глаз, если ты ещё раз спросишь меня о цветах!»
— Аноним, опрос о цветах.
Рэндел выражает огромную благодарность всем участникам опроса за помощь в исследовании цветов. Более пяти миллионов названий цветов предложили люди в 222 500 опросах. Если вы в этом не участвовали, слишком поздно вносить какие-то данные, но, если хотите, можете посмотреть результаты и позабавиться.
Для начала несколько общих наблюдений:
- Если довольно долго спрашивать людей о названии цвета, они однозначно звереют.
- Поносный и блевотный цвета действительно существуют.
- Дальтоники чаще впадают в отчаяние и посылают всё это.
- В русском языке существует мнемоническая фраза для запоминания цветов радуги: «каждый охотник желает знать, где сидит фазан». В английском это акроним ROY G. BIV(red — красный, orange — оранжевый, yellow — жёлтый, green — зелёный, blue — синий, indigo — индиго, violet — фиолетовый). Рэндел полагает, что на самом деле это может быть акроним ROY GBP (red, orange, yellow, green, blue, purple — пурпурный) с буквами C (cyan — бирюзовый) или T (teal — сине-зелёный) между G (green) и B (blue), так как, судя по карте цветов, расположенной ниже, эти цвета находятся между зелёным и синим.
- Несколько десятков человек использовали названия цветов в SQL. Неплохая попытка, детки.
- Никто не смог правильно написать fuchsia (фуксия).
В целом, было действительно здорово и очень интересно анализировать результаты. Возникло несколько проблем при опросе, которые обсуждаются в конце поста. Но объёмы данных крутые.
Пол
По странному совпадению, в ту ночь, когда Рэндел опубликовал первый опрос о цветах, в популярной серии комиксов Догхаус Дайрис (Doghouse Diaries) вышел этот комикс (который автор изменил немного для своего блога):

Переводить названия цветов здесь не очень уместно, так как вся суть сводится к тому, как называют цвета америкосы, но, чтобы было понятнее, наш вариант схемы:

Это было забавно, и Рэндел понял, что может проверить, так ли это. После завершения опроса, он создал свою версию Догхаус Дайрис с настоящими самыми популярными названиями цветов:


Женщины были немного более либеральными. И мужчины, и женщины, как правило, одинаково называли цвета.
Рэндел был этим удовлетворен. Тогда он решил вычислить «самые мужские» и «самые женские» цвета. Он искал названия цветов, пропорционально более популярные среди каждой группы, то есть те, которые назвало большее количество женщин сравнению с наименьшим количеством мужчин (или наоборот).
Вот названия наиболее популярных «женских» цветов:
- Цвет серовато-коричневой заварки (Dusty Teal).
- Розовый румянец (Blush Pink).
- Грязный лавандовый (Dusty Lavender).
- Масляно-жёлтый (Butter Yellow).
- Сумрачная роза (Dusky Rose).
Да уж, довольно витиевато, конечно. Типа, «бомба с благовониями взрывается в атмосфереБэд Бас и Бейонд». Что ж, давайте посмотрим на второй список.
Вот названия цветов, наиболее популярных среди мужчин:
- Член (Penis).
- Гей (Gay).
- Что за херня (WTF)?
- Понятия не имею (Dunno)?
- Бежевый (Baige).
Это не опечатка, номер 5 — единственный реальный цвет, его просто неправильно пишут (на самом деле — «beige»). Эти данные основаны на количестве уникальных людей, которые ответили на вопросы о цветах. Это не спам, так как подсчёт был проведен после работы спамфильтра.
Рэндел в шоке от своего пола. Но по делу.
Значения цветов RGB
Вот значения первых 48 из примерно тысячи цветов RGB, которые (на среднем мониторе, на белом фоне) Рэндел определил с достаточно высокой степенью точности:


Посмотрите также полную таблицу из 954 цветов, она доступна и в виде текстового файла.
Значения RGB для названий основаны на расположении в цветовой модели, где это название чаще всего выбирали. Это было сложно вычислить. Рэндел испробовал простые геометрические средства (по сути, неполноценно), грубую силу опроса обо всех потенциальных центральных точках (слишком медленно) и установку ядра функции плотности (математически трудно). В конце концов, он использовал среднее число запусков стохастического алгоритма поиска экстремума. Заметки об обработке данных для этого списка, смотрите комментарий внизу этой страницы.
Правописание и спам
Орфография стала проблемой для многих пользователей:

Вы можете заметить, что здесь нет правильного написания. Даже Гугль выдает вот что:

Друг Рэндела отметил, чтобы написать правильно, нужно подумать об этом как о «fuck-sia» («fuch-sia»).
В базу данных поступало много спама, но Рэндел использовал неплохие фильтры. Он заблокировал людей, которые давали слишком много ответов с названиями цветов, которые не используют другие люди. Если пользователи давали одинаковые ответы несколько раз о цветах различных оттенков, он откидывал эти результаты. Это, в основном, касалось тех, кто набрал одно и то же снова и снова. Некоторые из них пользовались, очевидно, скриптами. Первым среди спамеров в базе данных был кто-то, кто назвал 2 400 цветов, и все с одинаковым оскорблением на расовой почве.
Карта
Вот карта цветовых границ для определенной части куба аддитивной цветовой модели. Это лишь частичные данные опроса (1,5 миллиона результатов), выбранные для этого диапазона, при показе на черном и белом фоне.

Посмотрите собранные для этой карты данные (текстовый файл 3,6 Мб). Несмотря на просьбы, Рэндел не планирует делать из этого плакаты, ему кажется неправильным воспользоваться такими усилиями добровольцев для получения прибыли, он только хотел посмотреть, какими будут результаты. Тем не менее, он разрешает распечатать один для себя (карта в большом размере), но напоминает, что цвета на печати отличаются от цветов на мониторе.
Основные проблемы
Конечно, есть некоторые проблемы в этом исследовании цветов. Люди узнают цвета, которые они видели раньше, что добавляет лишние помехи и некоторые предубеждения (хотя в конце все выровнялось). Кроме того, все мониторы разные, RGB не является абсолютным цветовым пространством. К счастью, Рэндел был действительно заинтересован в том, как цвета будут выглядеть на типичных мониторах, поэтому большинство этих данных годятся для пользователей не являющимися дальтониками и работающими на любых мониторах (люди использовали > 90% жидкокристаллических экранов и примерно 6% мониторов с электронно-лучевой трубкой).
Исследование цвета — действительно увлекательная тема, тем более, когда мы узнали так много различных и зачастую противоречивых представлений о радуге, различных основных цветах и частоте света. Если вы хотите побольше об этом узнать, почитайте введение в главе 35 лекции Фейнмана по физике (том 1), прочитайте частые вопросы у Чарльза Пойнтонаили просто просмотрите ссылки из статьи в Википедии о цвете. Для данного исследования использована RGB-модель и стандартный монитор, так что данные можно использовать для сбора и наименования цветов на экране компьютера. И действительно, если вы читаете этот блог, вероятнее всего, проводите больше времени, глядя на монитор, чем куда-либо еще.
Перевод статьи от 3 мая 2010.