Евгения Суслова — «Графический пользовательский интерфейс»

Евгения Суслова, приглашенный исследователь проекта 
“Знание на экране: Интерфейсы и визуализация в цифровых гуманитарных проектах” в рамках карамзинских стипендий-2016 (ШАГИ РАНХИГС, фонд Прохорова)

«ИНТЕРФЕЙСЫ»

Какие образы лежат в основе нашего взаимодействия с GUI? Какова политика GUI и степень нашей собственной свободы, когда нам кажется, что мы можем все, находясь внутри «интерактивной» культуры?

Графический пользовательский интерфейс (GUI) — это интерфейс, где все элементы представлены в виде объектов, которыми мы можем манипулировать. Это кажется сегодня чем-то очень привычным, однако так было не всегда. «Объектный поворот» произошел в начале 1970-х и радикально изменил нашу жизнь как информационных существ. Как именно это произошло?

Где интерфейс? Компьютер как пограничная территория

Само слово «интерфейс», как отмечает Мэтью Фуллер в составленном им «Лексиконе исследований программного обеспечения», заимствовано из химии и обозначает «поверхность, создающую общую границу между двумя телами, пространствами, фазами». Интерфейсы компьютера соединяют аппаратную часть компьютера, железо (hardware), и программную часть, софт (software), друг с другом, а также с пользователями и другими источниками данных.
 
Элементы триады аппаратная часть — программа — пользователь /данные находятся друг с другом в специфических отношениях. Если привычные синтаксические модели описывают ту или иную ситуацию, собирая ее языковой образ из логико-грамматических элементов (кто? — субъект/подлежащее, что делает? — предикат/сказуемое, по отношению к кому или чему? — дополнение, где, когда и как? — обстоятельство), то для ситуации человеко-машинного взаимодействия такая модель не подходит:

Одно и то же здесь может быть сразу и «кто», и «что делает». Например, компьютерная программа или любой объект рабочего стола как объекты в свернутом виде содержат все возможные предикаты, то есть артикулируемые манипуляции, которые мы могли бы с ними совершить.

Включение в мир человеческих отношений компьютеров, диктующих свои правила человеко-машинного взаимодействия, ведет к необходимости переосмысления самой структуры ситуации, в которой происходит переживание подобного опыта. У нас появляются новые способы хранения информации и ее организации, возможности распределенной совместной работы над текстом или кодом, коммуникация становится сверхбыстрой. То, что раньше было невидимым, обретает зримую форму — например, математические модели, лежащие в основе различных видов визуализации. Понимание этих новых ситуаций невозможно без понимания природы технического объекта.

Исходя из треугольника железо — софт — пользователь/данные М. Фуллер предлагает следующую классификацию интерфейсов:

Железо + пользователь

Железо, соединяющее пользователя с железом (устройства ввода-вывода, например, клавиатура, а также устройства обратной связи, например, экран или динамик);

  • Железо + железо — Железо, соединяющее железо с железом (например, система линий связи);
  • Софт + железо — Софт, соединяющий железо с софтом (например, драйверы устройства);
  • Программа + программа — Спецификации и протоколы, определяющие отношения между программой и программой (прикладной программный интерфейс, API);
  • Пользовательский интерфейс — Символические «ручки», которые, в соединении с (1) приспосабливают софт к нуждам пользователя. Это и есть интерфейс пользователя, частной разновидностью которого можно считать графический пользовательский интерфейс.

Такой подход позволяет осознать, что пользовательский интерфейс — это лишь небольшой фрагмент множества других интерфейсов компьютера, понимаемых как функциональные границы. Но такое видение выявляет и разрыв между «техническим» и «культурным» определением пользовательского интерфейса. Говоря иначе, понимание того, как устроен компьютер и как он функционирует, не позволяет напрямую понять культурное значение этого технического объекта.

Инструкция, прилагающаяся к устройству, так же далека от реальной роли компьютера в человеческом опыте, как словарь и грамматика — от реального функционирования языка.

Построение комплексного понимания этих взаимодействий требует рассмотрения графического пользовательского интерфейса в связи с различными культурными моделями репрезентации, непосредственно или косвенно повлиявшими на его становление.

Скачок к новой нелинейности. Графический пользовательский интерфейс и время

Истоки формирования принципов графического пользовательского интерфейса исследователи видят сразу в нескольких явлениях послевоенного времени.

Вэнивар Буш в статье «Как мы можем мыслить» предлагает проект мемекса (memex) — гипертекстового устройства для хранения данных, доступа к ним и их комментирования. Название устройства происходит от соединения двух слов «memory» и «index». Мемекс должен был представлять собой стол с полупрозрачными экранами, на которые проецировалась информация, являясь, по сути, прообразом персонального компьютера на основе микрофильмирования — получения на пленке уменьшенных копий бумажных документов. Также у мемекса предполагались клавиатура, кнопки и рычажки. Доступ к информации, например, к книге осуществлялся бы посредством специальной системы индексации «легче, чем если бы ее нужно было брать с полки». В основе этого воображаемого гипертекстового устройства лежал не принцип каталога, а принцип ассоциаций — по аналогии с тем, как работает человеческая память. С той лишь разницей, что человек забывает, а машина — нет.

Не только Буш пользовался приемом переноса свойств органических объектов на технические. В эпоху Ренессанса это был один из основных способов изобретать: Леонардо да Винчи, наблюдая за нюансами полета птиц, придумывал свои летательные аппараты. Метод ассоциаций отличается от каталожного тем, что благодаря такому подходу объекты объединяются не по принципу склада, а по принципу фабрики: с ними можно что-то делать, при этом сохраняя последовательность действий. Буш предполагал фиксировать весь процесс получения данных, то есть составлять своеобразные маршруты памяти на общей карте информации. Мемекс должен был стать первым десктопом — рабочим столом в буквальном смысле этого слова.

Первая компьютерная мышь была деревянной и по форме напоминала куб. На ее нижней части располагалось два металлических диска: один позволял двигать мышью вперед-назад, а второй — влево-вправо. Провод на конце действительно напоминал хвост, за что изобретение и получило свое громкое имя — «мышь»

«Мать всех демонстраций» (The Mother of all Demos, 1968) — это название презентации Дугласа Энгельбарта, прошедшей 9 декабря 1968 года, где он представил такие экспериментальные технологии, как гипертекст, средство для видеоконференции, электронную почту и систему для распределенной работы NLS

Параллельные поиски осуществлял Айвен Сазерлэнд, в 1963 году разработавший программу Sketchpad — графический редактор, в основе которого лежала идея прямого манипулирования объектами на экране с помощью светового пера. Таким образом Сазерлэнд разом заложил основы и объектно-ориентированного программирования, и автоматизированного проектирования, и графического пользовательского интерфейса: везде в основе лежит идея объекта, которым можно манипулировать. В парадигме объектно-ориентированного программирования каждый объект относится к тому или иному классу; автоматизированное проектирование дает возможность виртуального изображения объекта; графический пользовательский интерфейс также предполагает, что мы будем оперировать папками, вкладками и другими видимыми объектами.

В конце 1960-х был разработан проект персонального компьютера для детей — Dynabook (сокращение от «динамическая книга»), автором которого стал Алан Кей. Он понимал, что скоро компьютерные способы хранения и организации информации начнут конкурировать с «бумажной» индустрией, поэтому необходимо создавать новые образовательные технологии, способные в будущем заменить книги. Этот персональный компьютер должен был быть портативным и представлять собой что-то вроде современных планшета или ноутбука. Специально для него был разработан графический пользовательский интерфейс Star GUI с уже знакомыми нам элементами: окнами, меню и и др. Этот проект не реализовался. Зато в начале 1970-х, с появлением микропроцессоров, многие идеи Кея воплотились в разработанном им и его командой в Xerox PARC компьютере Alto, где действия осуществлялись не посредством ввода команд, а с помощью выбора из вариантов меню пунктов с помощью мыши. Объектно-ориентированный язык Smalltalk, созданный все тем же Аланом Кеем, уже демонстрировал интерфейс с окнами, а ориентация на экране осуществлялась с помощью курсора и мыши.

Утверждается принцип WIMP (window, icon, menu, pointing device) — способ организации графического пользовательского интерфейса и взаимодействия с ним посредством ключевых элементов: окон, иконок, меню и указателей. В начале 1980-х, как известно, появляется персональный компьютер Apple Lisa, а чуть позже — компьютеры Macintosh и надстройка Microsoft Windows, затем ставшая полноценной операциональной системой. После этого принципиальных изменений логика графического пользовательского интерфейса не претерпевала.

GUI становится последним порогом видимости, задающим логику пользовательского взаимодействия с компьютером. Именно в этой точке проявляется «политический» смысл интерфейса.

Теперь осуществлять доступ к информации, задавать принципы ее организации и диктовать условия информационного поведения — это то, посредством чего можно управлять, оставаясь невидимым.

С одной стороны, GUI позволяет каждому взаимодействовать с компьютером на интуитивном уровне. С другой стороны, это то, что в ситуации закрытого кода, то есть невозможности редактировать систему, «замораживает» диалог с техникой. Пользователя буквально заставляют принимать систему как готовую данность, оставляя проблему принципиального выбора на откуп власти — например, разработчикам.

Жильбер Симондон, прежде всего известный как философ техники и открытый русскоязычной публике Михаилом Куртовым, писал о том, что «фундаментальное отчуждение коренится в разрыве между онтогенезом технического объекта и его существованием. Необходимо, чтобы генезис технического объекта стал действительной частью его существования и чтобы отношение человека к техническому объекту включало в себя внимание к его непрекращающемуся генезису» (пер. М. Куртова). Иначе говоря, технический объект на полном основании может стать частью современной культуры только в том случае, если будет установлена связь между предпосылками его появления и развития и способом его функционирования как источником новых форм коммуникации.

Инвариантность интерфейса

Графический пользовательский интерфейс (GUI) пришел на смену текстовому пользовательскому интерфейсу (TUI), разновидностью которого является интерфейс командной строки (CLI, или консоль). Ввод с клавиатуры текстовых команд осуществлялся линейно в виде бесконечной ленты, по сути, дублирующей материальный носитель. Когда от логики команд осуществляется переход к логике меню, то «миметический субстрат» (логика свитка или бесконечной ленты) исчезают.

Метафору ленты сменяет метафора рабочего пространства, а коммуникацию диалога («вопросно-ответную» структуру взаимодействия с интерфейсом командной строки) сменяет коммуникация на основе манипуляций.

Возможность существования операциональной среды в нелинейном виде заставляет поставить вопрос о характере связи между элементами графического пользовательского интерфейса. В истории культуры накоплены разнообразные модели нелинейного соположения визуальных элементов. В древнем искусстве, например, в иконописи действовал закон «суммирования зрительного впечатления», согласно которому один и тот же объект мог изображаться в рамках одной и той же ситуации, но в разных, как правило, следующих друг за другом, временных фазах. Это явление называлось «сложным переводом»:

«В русской иконописи прием этот особенно часто можно встретить в клеймах, которые могут органически переходить одно в другое, без какой-либо границы между изображениями разных сцен, создавая таким образом единую временную направленность житийного повествования»

Так, на иконе «Усекновение главы Иоанна Предтечи» голову мы видим дважды: до отрубания, на плечах Иоанна Предтечи, и после, уже лежащую на земле. На иконах с клеймами часто нет четких границ между «кадрами», но есть чистая длительность повествования.

То же самое можем видеть на эфиопских миниатюрах, в русском лубке и современных комиксах. Также важной культурной моделью, имеющей типологическое отношение к принципу организации графического пользовательского интерфейса, является техника полиэкрана, ставшая возможной после изобретения параллельного монтажа, открытого в кинематографе первой половины XX века Дэвидом Уорком Гриффитом. Подобная дискретизация и — одновременно с этим — соположение несоположного приводят к тому, что в новых медиа линейность заменяется «рандомным доступом», ведущим и к изменению природы самого пространства, в котором этот доступ осуществляется.

полиэкран из фильма Питера Гринуэя «Ад Данте»

При переходе от линейной (текстовой) логики к логике нелинейной (логике графического интерфейса) происходит абстрагирование пространства, в котором и осуществляются заданные возможностями программы действия. Михаил Куртов в книге «Генезис графического пользовательского интерфейса. К теологии кода», опираясь на идею Жильбера Симондона о разделении на структуры и операции, подчеркивает связь появления графического интерфейса с эволюцией языков программирования, развивавшихся в логике наращивания уровней абстракции. Философ показывает принципиальные корреляции между графическим пользовательским интерфейсом и объектно-ориентированным программированием и пытается приблизиться к новой онтологии технического объекта.

Интерфейс как дополнительное измерение действия

Изначально цифровые интерфейсы по инерции стремились дублировать аналоговые, оцифровывая все: кнопки, рычаги и ручки, бумагу, карандаши, кисти и другие инструменты. Чтобы в этом убедиться, достаточно посмотреть, например, на рабочие интерфейсы Photoshop и Reaper. Однако со временем цифровые интерфейсы как будто начинают конструировать свою собственную онтологию.

Аарон Келлерман в книге «Географические интерпретации Интернета» показывает, что мы в нашем повседневном опыте систематически осмысляем Интернет как пространство — со своей собственной географией, способами установления дистанций и передвижения, своими скрытыми территориями и временно автономными зонами. Неслучайно мы ищем информацию «на просторах Интернета», а сами «сидим» в Интернете; поиск также связан с идеей сёрфинга (англ. to surf, фр. surfer). Поэтому с появлением и развитием Интернета графический пользовательский интерфейс также осмысляется в неразрывной связи с ним, его онтологией и операторикой.

Графический интерфейс все меньше становится привязан к существующим жизнеподобным моделям и все больше погружается в зону экспериментирования и становится пунктом выработки новой субъективности. Особенно важны в этом отношении интерфейсы компьютерных игр, в которых граница между виртуальным и невиртуальным пространствами действия зачастую не столь очевидна, как в случае с военными игровыми тренажерами.

Взаимодействие с игровыми интерфейсами ведет к специфическому перераспределению субъективности между ментальным и телесным планами, за счет чего может измениться отношение к деятельности в неигровом пространстве.

Так, в игре Ingress предлагается захватывать порталы, находящиеся на месте тех или иных примечательных мест в районе местонахождения игрока, передвигающегося по местности с телефоном. Повседневное окружающее нас пространство приобретает еще одно измерение. Так как все игроки делятся на два лагеря, то перевес в той или иной местности всегда либо у одних, либо у других. Подобное «активное» отношение к близлежащим территориям распространяется на виртуальный план, не проникая в план гражданских инициатив, ведущих к преобразованию окружающего пространства, но так или иначе подталкивает к переосмыслению среды через позицию игрового субъекта.

Теперь мы проектируем не только отдельные объекты, а пространства и способы взаимодействия, а понятия архитектуры и инфраструктуры переносятся в область виртуального.

Развитие компьютерных методов визуализации приводит к созданию области информационного дизайна (Information design), задачей которого является проектирование форм организации и репрезентации информации, а также к обособлению такой области, как проектирование взаимодействия (User Experience, UX), в которой интерфейс рассматривается с точки зрения пользователя, учитывая его особенности восприятия и (пользовательский) опыт.

Закрытость системы для редактирования кода (исключение составляют отдельные системы типа Linux) и полная свобода в проектировании графического пользовательского интерфейса создают странную ситуацию кажущейся всесильности спроектировать всё, но при практически полном отрыве «логики поверхности» от «логики системы». Мы умеем взаимодействовать, но при этом можем вообще не представлять, как технический объект устроен и какие знания и технологии в нем «сконцентрированы». Таким образом, графический пользовательский интерфейс оказывается и гуманитарной границей при взаимодействии с компьютером, определяя человеко-машинное взаимодействие по эту сторону. Должен ли гуманитарий уметь программировать, если программирование — это язык? Лев Манович считает, что это абсолютно необходимый навык для современного исследователя. Или вопросы, так или иначе связанные с новыми технологиями, должны оставаться в сфере сугубо технических исследований?

Сегодня происходит активное взаимопроникновение этих двух областей, результатом которого, например, стала такая дисциплина, как цифровые гуманитарные науки (Digital Humanities).

Изучение специфики гуманитарного и пользовательского (специфики, опыта и т.д.) еще ждет своего исследователя. Однако даже анализ особенностей графического пользовательского интерфейса как элемента в ряду других социальных явлений, достаточно точно характеризует современную культуру как систему нелинейных дискретных взаимодействий, систему не столько объектов, сколько операций. Добро пожаловать в культуру «аллагматики», как писал Ж. Симондон.

  1. Cramer F., Fuller M. Interface // Software studies: a lexicon, ed. by Matthew Fuller. London: The MIT Press, 2008.
  2. Bush V. As we may think. The Atlantic Monthly, July 1945.
  3. Tuck, Mike. The Real History of the GUI, August 13th, 2001.
  4. Симондон Ж. О способе существования технических объектов.
  5. Успенский Б. Семиотика иконы // Успенский Б. Семиотика искусства. М.: Школа языки русской культуры, 1995.
  6. Manovich L. The Language of New Media. London: The MIT Press, 2001.
  7. Куртов М. Генезис графического пользовательского интерфейса. К теологии кода. СПб.: Транслит, 2014.
  8. Kellerman A. Geographic Interpretations of the Internet. Haifa: University of Haifa, Springer, 2016.
  9. Raskin J. The Humane Interface. New Directions for Designing Interactive Systems. Boston: Addison-Wesley, 2000, p. xi; (на русском языке).
  10. Kay A. User Interface: A Personal View // The Art of Human-Computer Interface Design, ed. Brenda Laurel. Reading, MA: Addison-Wesley, 1990.
  11. Harwood J. The Interface: IBM and the Transformation of Corporate Design 1945–1976, Minneapolis, London: University of Minnesota Press, 2011.
  12. Johnson S. Interface Culture: How New Technology Transforms the Way We Create and Communicate. San Francisco: HarperEdge, 1997.
  13. Galloway А. The Interface Effect, Cambridge / Malden, Massachusetts: Polity, 2012.

Originally published at cultlook.org.