구글 I/O: “책임감 있는 인공지능” 실무 적용 방법은?

Dasol Hong
6 min readMay 15, 2023

--

구글 I/O 소개 페이지 출처: https://io.google/2023

5월 10일 Google I/O* 발표에서 구글 기술 및 사회 팀 수석 부사장 제임스는 구글에서 개발하고 있는 책임감 있는 인공지능에 대한 사례를 설명했습니다.

  • 1. 잘못된 정보 문제 해결 위한 정보 워터마킹
  • 2. 합성 오디오를 감지 위한 도구 개발
  • 3. 인공지능 더빙 서비스에서 오용을 제한하는 보호 장치 개발
  • 4. 대규모 언어 모델의 악성(toxic) 완화를 보장하기 위한 구글 지주회사 알파벳의 자회사 Jigsaw에서 개발한 퍼스펙티브 API 사용

🤔 프로덕트 매니저로써 GPT와 같은 대규모 언어 모델을 제품에 적용할 때 사용자에게 불편함을 줄 수 있는 가능성(예, 공격적인 표현을 출력하는 경우)을 최소화할 수 있는 방법에 대한 고민이 많은데요. 이를 돕는 Perspective API에 대해서 소개하겠습니다.

*Google I/O는 매년 구글의 다양한 기술들과 새로운 제품을 발표하는 자리입니다. I/O는 Input/Output을 의미하기도 하며 Innovation in the Open을 나타내기도 합니다.

Perspective 모델은 무엇인가요?

Perspective 모델은 머신 러닝 모델을 사용하여 폭력적인 댓글을 식별합니다. 이 모델은 텍스트가 상대방에게 미칠 수 있는 영향에 따라 문구에 점수를 매깁니다. 이 점수를 사용하여 다음 3가지를 돕습니다.

  • 1. 댓글 작성자에게 피드백을 제공합니다.
  • 2. 운영자가 댓글의 악성(toxic) 언어를 더 쉽게 검토할 수 있도록 돕습니다.
  • 3. 독자가 악성(toxic) 언어를 필터링하는 데 도움을 줄 수 있습니다.
Perspective 모델은 여러 가지 속성에 대한 점수 제공에 대한 시각화 자료/ 출처: https://developers.perspectiveapi.com/s/about-the-api?language=en_US

Perspective 모델은 어떤 속성에 대한 점수를 제공하나요?

  1. 악성의 심한 정도 (Severe Toxicity)
  2. 모욕 (Insult)
  3. 욕설 (Profanity)
  4. 익명 공격 (Identity attack)
  5. 위협 (Threat)
  6. 성적으로 노골적인 내용 (Sexually explicit)

Perspective는 어떤 언어를 지원하나요?

Perspective API*는 한국어, 아랍어, 중국어, 체코어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 스웨덴어로 무료로 사용할 수 있습니다. 이외에 새로운 언어를 지원하기 위해 지속적으로 모델을 개발하고 있습니다.

개발 중인 언어에 대해 자세히 알아보려면 개발자 사이트를 방문하세요.

*API란 프로그램 간 정보 교환을 통해 소통할 수 있게 하는 방식입니다. 예를 들어, 프로그램에 내가 원하는 정보를 요청(input)하고 결과를 받아오는 (output)방식입니다.

🤔 Perspective의 실제 활용 예시가 있을까요?

뉴욕 타임즈

  • Perspective API 적용 후 : 커뮤니티가 번창할 수 있도록 댓글 섹션을 계속 열어두는 기사의 수가 3배로 늘었습니다.
  • Perspective API 적용 전 문제점: 뉴욕 타임즈는 기사의 약 10%에 대해서만 댓글을 조정할 수 있었으며, 나머지 기사에서는 댓글을 비활성화해야 했습니다. 뉴욕타임스의 많은 독자들은 댓글 섹션의 대화를 기사 자체만큼이나 중요하게 여기며 댓글 자체가 기사의 일부가 되기도 합니다.
  • Perspective API 적용 방법: 뉴욕 타임즈와 Perspective API 팀은 협력하여 기사 댓글 속 욕설이나 온라인 괴롭힘을 발견하고, 유해성에 따라 댓글에 점수를 매기는 데 사용할 수 있는 도구인 모더레이터를 개발했습니다. 뉴욕타임즈는 이 정보를 사용하여 댓글 작성자에게 실시간으로 피드백을 제공하고, 인간 모더레이터가 댓글을 더 빠르게 분류할 수 있도록 지원합니다.

📌 Perspective API는 개인과 회사의 콘텐츠 관리 부담을 덜어주기 위한 것이지, 사람의 의사 결정권자의 업무를 완전히 대체하기 위한 것은 아닙니다.

Perspective를 어떻게 사용하는지 더 궁금한 분들은 사례 연구 페이지에서 자세히 알아보세요. 🔗 https://perspectiveapi.com/case-studies/

Perspective 모델을 필요에 맞게 커스텀하는 방법

  1. 사용하려는 속성 조합을 선택하세요.
  2. 지원하려는 언어를 선택하세요.
  3. 출력에 기반하여 어떤 액션을 취할지 선택하세요.

Perspective API를 사용해 보세요!

여러분도 Perspective API에 들어가서 체험해 보세요. 내가 표현하는 언어가 상대를 존중하지 않은 표현인지를 확인하고 싶으면 아래 이미지 속 우측 입력 상자에 입력하면 입력 상자 왼측 하단에 상대방이 해당 표현을 몇 퍼센트로 독성으로 느낄 수 있는지 나타냅니다.

사용자가 상대를 존중하지 않은 표현을 우측 입력 상자에 입력하면 입력 상자 왼측 하단에 상대방이 몇 퍼센트로 해당 표현을 악성으로 느낄 수 있는지 나타냅니다. 출처: https://perspectiveapi.com/

5명의 다양한 배경의 사람들과 인공지능 윤리에 대한 다양한 관점을 다루는 뉴스레터를 시작했습니다. 저는 주로 실무에 적용할 수 있는 책임감 있는 인공지능(Responsible AI)에 대해서 다룰 예정입니다. 어떻게 접근해야할지 모르겠는 인공지능 윤리를 쉽게 풀어내보려고 합니다. 🤗

매주 월요일 오전 8시, 여러분의 출근길에서 인공지능 윤리에 대해서 저희와 함께 생각해 보시면 어떨까요? ➡️ 🦜AI 윤리 레터를 구독하기

--

--