Что такое компьютерное зрение и удивительные способы его использования в бизнесе

Илья Грачев
profisoft
Published in
4 min readSep 17, 2019

Оказывается, что то, что большинство людей воспринимает как должное — способность видеть и обрабатывать увиденное — чрезвычайно трудно воспроизвести в машинах. Именно на это нацелено компьютерное зрение (CV). Хотя компьютерное зрение, возможно, не так развито, как человеческое, оно настолько развито, что сегодня оно очень полезно в бизнесе. В данной статье больше информации о том, что такое компьютерное зрение и как оно используется в бизнесе.

Что такое компьютерное зрение?

Компьютерное зрение описывает процесс, когда компьютер, использующий алгоритмы искусственного интеллекта, может идентифицировать и обрабатывать изображения (фотографии, видео и т. д.). А затем создавать соответствующие результаты анализа, поскольку компьютер действительно может «понимать» контент. В частности, компьютерное зрение может классифицировать, идентифицировать, проверять и обнаруживать объекты. Развитию компьютерного зрения в последние годы способствовали технологии машинного обучения, в частности, итеративный процесс обучения нейронных сетей, и значительные скачки в вычислительной мощности, хранении данных и высококачественных, но недорогих устройствах ввода.

Есть три основных компонента компьютерного зрения.

1. Получение изображения: когда цифровая камера захватывает изображение, она создает цифровой файл, состоящий из нулей и единиц.

2. Обработка: алгоритмы используются для определения основных геометрических элементов для построения изображений из двоичных данных.

3. Анализ: на этом последнем этапе компьютерного зрения данные анализируются. Алгоритмы высокого уровня используются для принятия решений на основе изображений.

Проблемы с воспроизведением этой способности в машинах были недооценены. То, что сначала казалось простой задачей, оказалось, потребовало десятилетий исследований. В визуальном мире много сложностей, и еще многое неизвестно о том, как работает зрение человека и как мозг воспринимает визуальный вклад.

Хотя до сих пор область компьютерного зрения преодолела многие проблемы, все еще существуют препятствия, которые необходимо решить в зависимости от того, для чего используется компьютерное зрение и какие данные он может получить. Компьютерное зрение требует больших мощностей и памяти для обработки данных, плюс на результаты могут влиять качество изображений / данных. Ученые все еще работают над оптимизацией компьютерного зрения для всех приложений.

Как компьютерное зрение используется в бизнесе?

Существуют бесконечное количество приложений, в которых полезна возможность извлекать смысл из «видения» визуальных данных. Компьютерное зрение сочетается с другими технологиями, такими как дополненные и виртуальные реальности, чтобы обеспечить дополнительные возможности.

Распознавание лиц, основанное на компьютерном зрении, используется для систем наблюдения и безопасности, а также для технологии Facebook, которая позволяет идентифицировать людей на фотографиях. Китай использует технологию распознавания лиц в работе полиции, платежных порталах и многом другом. Даже розничные магазины используют эту технологию для мониторинга запасов, отслеживания покупателей в магазине и позволяют покупателям обходить кассовый аппарат, оплачивая их практически тогда, когда технология распознавания лиц выставляет их на свой счет.

Многие производители автомобилей от Форда до Теслы изо всех сил пытаются запустить свою версию автономного транспортного средства в массовое производство. Компьютерное зрение является критически важной технологией, которая делает возможными автономные транспортные средства. Системы на автономных транспортных средствах непрерывно обрабатывают визуальные данные от дорожных знаков до наблюдения транспортных средств и пешеходов на дороге, а затем определяют, какие действия предпринять.

Компьютерное зрение в медицине помогает в диагностике заболеваний и других недугов и расширяет возможности хирургов во время операций. В настоящее время существуют приложения для смартфонов, которые позволяют диагностировать состояние кожи с помощью камеры телефона. Фактически, 90 процентов всех медиальных данных основаны на изображениях — рентгеновские снимки, сканы и т. д. И многие из этих данных теперь можно анализировать с помощью алгоритмов.

Цифровой маркетинг. Используя компьютеры для сортировки и анализа миллионов онлайн-изображений, маркетологи могут обойти традиционные демографические исследования и по-прежнему ориентировать маркетинг на нужную онлайн-аудиторию и выполнять эту работу значительно быстрее. Маркетологи даже используют компьютерное зрение, чтобы не размещать рекламу рядом с контентом, который является противоречивым или проблематичным для его аудитории.

Финансовые учреждения используют компьютерное зрение, чтобы предотвратить мошенничество, разрешить мобильные депозиты и визуально отображать числовую информацию.

В производстве компьютерное зрение делает вещи более эффективными, действенными и безопасными. Он используется в профилактическом обслуживании для выявления проблемы до возникновения поломок, а также в мерах контроля качества. Количество предметов, которое машина может проверить, значительно превосходит способность человека делать то же самое.

Сельскохозяйственная отрасль использует компьютерное зрение, чтобы сделать операции более успешными, отслеживая поля в поисках признаков болезни или вредителей, чтобы можно было принять быстрые меры по ее искоренению. John Deere представила полуавтономный зерноуборочный комбайн, который может найти оптимальный маршрут прохождения урожая после анализа качества собираемого зерна.

Извлечение и анализ рукописного текста: компьютерное зрение может переводить рукописные заметки о заседаниях или творческий мозговой штурм в цифровые форматы, которые облегчают передачу другим сотрудникам компании.

Приложения компьютерного зрения настолько разнообразны, что трудно представить бизнес, который не мог бы извлечь из этого пользу.

--

--