구글 I/O: “책임감 있는 인공지능” 실무 적용 방법은?
5월 10일 Google I/O* 발표에서 구글 기술 및 사회 팀 수석 부사장 제임스는 구글에서 개발하고 있는 책임감 있는 인공지능에 대한 사례를 설명했습니다.
- 1. 잘못된 정보 문제 해결 위한 정보 워터마킹
- 2. 합성 오디오를 감지 위한 도구 개발
- 3. 인공지능 더빙 서비스에서 오용을 제한하는 보호 장치 개발
- 4. 대규모 언어 모델의 악성(toxic) 완화를 보장하기 위한 구글 지주회사 알파벳의 자회사 Jigsaw에서 개발한 퍼스펙티브 API 사용
🤔 프로덕트 매니저로써 GPT와 같은 대규모 언어 모델을 제품에 적용할 때 사용자에게 불편함을 줄 수 있는 가능성(예, 공격적인 표현을 출력하는 경우)을 최소화할 수 있는 방법에 대한 고민이 많은데요. 이를 돕는 Perspective API에 대해서 소개하겠습니다.
*Google I/O는 매년 구글의 다양한 기술들과 새로운 제품을 발표하는 자리입니다. I/O는 Input/Output을 의미하기도 하며 Innovation in the Open을 나타내기도 합니다.
Perspective 모델은 무엇인가요?
Perspective 모델은 머신 러닝 모델을 사용하여 폭력적인 댓글을 식별합니다. 이 모델은 텍스트가 상대방에게 미칠 수 있는 영향에 따라 문구에 점수를 매깁니다. 이 점수를 사용하여 다음 3가지를 돕습니다.
- 1. 댓글 작성자에게 피드백을 제공합니다.
- 2. 운영자가 댓글의 악성(toxic) 언어를 더 쉽게 검토할 수 있도록 돕습니다.
- 3. 독자가 악성(toxic) 언어를 필터링하는 데 도움을 줄 수 있습니다.
Perspective 모델은 어떤 속성에 대한 점수를 제공하나요?
- 악성의 심한 정도 (Severe Toxicity)
- 모욕 (Insult)
- 욕설 (Profanity)
- 익명 공격 (Identity attack)
- 위협 (Threat)
- 성적으로 노골적인 내용 (Sexually explicit)
Perspective는 어떤 언어를 지원하나요?
Perspective API*는 한국어, 아랍어, 중국어, 체코어, 네덜란드어, 영어, 프랑스어, 독일어, 힌디어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 스웨덴어로 무료로 사용할 수 있습니다. 이외에 새로운 언어를 지원하기 위해 지속적으로 모델을 개발하고 있습니다.
개발 중인 언어에 대해 자세히 알아보려면 개발자 사이트를 방문하세요.
*API란 프로그램 간 정보 교환을 통해 소통할 수 있게 하는 방식입니다. 예를 들어, 프로그램에 내가 원하는 정보를 요청(input)하고 결과를 받아오는 (output)방식입니다.
🤔 Perspective의 실제 활용 예시가 있을까요?
뉴욕 타임즈
- Perspective API 적용 후 : 커뮤니티가 번창할 수 있도록 댓글 섹션을 계속 열어두는 기사의 수가 3배로 늘었습니다.
- Perspective API 적용 전 문제점: 뉴욕 타임즈는 기사의 약 10%에 대해서만 댓글을 조정할 수 있었으며, 나머지 기사에서는 댓글을 비활성화해야 했습니다. 뉴욕타임스의 많은 독자들은 댓글 섹션의 대화를 기사 자체만큼이나 중요하게 여기며 댓글 자체가 기사의 일부가 되기도 합니다.
- Perspective API 적용 방법: 뉴욕 타임즈와 Perspective API 팀은 협력하여 기사 댓글 속 욕설이나 온라인 괴롭힘을 발견하고, 유해성에 따라 댓글에 점수를 매기는 데 사용할 수 있는 도구인 모더레이터를 개발했습니다. 뉴욕타임즈는 이 정보를 사용하여 댓글 작성자에게 실시간으로 피드백을 제공하고, 인간 모더레이터가 댓글을 더 빠르게 분류할 수 있도록 지원합니다.
📌 Perspective API는 개인과 회사의 콘텐츠 관리 부담을 덜어주기 위한 것이지, 사람의 의사 결정권자의 업무를 완전히 대체하기 위한 것은 아닙니다.
Perspective를 어떻게 사용하는지 더 궁금한 분들은 사례 연구 페이지에서 자세히 알아보세요. 🔗 https://perspectiveapi.com/case-studies/
Perspective 모델을 필요에 맞게 커스텀하는 방법
- 사용하려는 속성 조합을 선택하세요.
- 지원하려는 언어를 선택하세요.
- 출력에 기반하여 어떤 액션을 취할지 선택하세요.
Perspective API를 사용해 보세요!
여러분도 Perspective API에 들어가서 체험해 보세요. 내가 표현하는 언어가 상대를 존중하지 않은 표현인지를 확인하고 싶으면 아래 이미지 속 우측 입력 상자에 입력하면 입력 상자 왼측 하단에 상대방이 해당 표현을 몇 퍼센트로 독성으로 느낄 수 있는지 나타냅니다.
5명의 다양한 배경의 사람들과 인공지능 윤리에 대한 다양한 관점을 다루는 뉴스레터를 시작했습니다. 저는 주로 실무에 적용할 수 있는 책임감 있는 인공지능(Responsible AI)에 대해서 다룰 예정입니다. 어떻게 접근해야할지 모르겠는 인공지능 윤리를 쉽게 풀어내보려고 합니다. 🤗
매주 월요일 오전 8시, 여러분의 출근길에서 인공지능 윤리에 대해서 저희와 함께 생각해 보시면 어떨까요? ➡️ 🦜AI 윤리 레터를 구독하기