각계각층과 스트레스 테스트, 리소스 공유..위험성 줄이고 안전 강화
개인정보 보호 책임..친구·가족과의 개인 메시지는 AI학습 용도 배제

메타 플랫폼즈 사로이터 연합
메타 플랫폼즈 사로이터 연합

 

[포쓰저널] 메타는 27일(현지시간) 챗GPT 기능과 유사한 '메타 AI'를 공개하며, '책임감있는 생성형 AI 구축'에 대해서도 강조했다.

28일(현지시간) 자사 홈페이지를 통해 메타 AI의 안전장치에 대해 소개했다.

메타에 따르면 책임감 있는 AI에 대한 약속을 지키기 위해 제품의 안전 성능을 개선하고자 스트레스 테스트(Stress test)를 실시하고 있다.

정책 입안자, 학계 및 시민 사회의 전문가, 업계 관계자들과 정기적으로 협력해 이 기술의 책임감 있는 사용을 발전시키고 있다. 이러한 기능을 단계적으로 도입하고 베타 버전의 AI를 출시할 예정이다.

'메타 AI'와 같은 새로운 텍스트 기반 경험을 제공하는 맞춤형 AI 모델은 메타의 최신 대규모 언어 모델(LLM)인 '라마 2'의 토대 위에 구축됐다. 안전 및 책임 학습을 활용하고 있다.

메타는 잠재적 취약성을 파악하고, 위험을 줄이고, 안전을 강화하고, 신뢰성을 강화하기 위해 취하고 있는 조치에 대해 상세히 설명하는 리소스를 공유하고 있다.

일례로 외부 및 내부 전문가와 함께 하는 레드팀 활동을 통해 대화형 AI를 평가하고 개선하고 있다. 전문가로 구성된 전담 팀이 수천 시간 동안 스트레스 테스트를 진행하며 취약점을 파악하고 수정하는 동시에 예상치 못한 방식으로 사용될 수 있는 방법을 찾고 있다.

유용한 응답을 제공할 가능성을 높일 수 있는 지침과 함께 고품질 이미지 생성 등 특정 작업을 수행하도록 모델을 훈련하는 것도 메타의 책임감있는 생성형 AI구축 노력에 포함된다. 안전 문제에 대응해 전문가가 지원하는 리소스를 제공하도록 훈련하고 있다.

예를 들어, AI는 특정 질문에 대한 응답으로 지역 자살방지 및 섭식 장애 관련 기관을 추천할 수 있지만, 의학적 조언은 제공할 수 없다고 메타는 분명히 밝혔다.

모델에겐 안전 및 책임 가이드라인을 교육하고 있다. 이를 통해 모든 연령대에 잠재적으로 유해하거나 부적절한 반응을 앱에서 공유할 가능성이 줄어든다.

편향성을 줄이기 위한 조치도 취하고 있다. 생성형 AI 시스템의 잠재적 편향성을 해결하는 것은 새로운 연구 분야다. 다른 AI 모델과 마찬가지로 더 많은 사람들이 기능을 사용하고 피드백을 공유하면 접근 방식을 개선하는 데 도움이 될 수 있다.

메타는 정책을 위반하는 콘텐츠를 찾아내 조치를 취할 수 있는 새로운 기술을 개발했다. 메타 팀은 유해한 반응이 사람들에게 다시 공유되기 전에 이를 스캔하고 걸러내는 알고리즘을 구축했다.

이러한 기능 내에 피드백 도구를 구축했다. 받은 피드백을 바탕으로 모델을 계속 학습시켜 안전 성능을 개선하고 정책 위반을 자동으로 감지할 수 있도록 한다는 계획이다.

메타는 오랜 ‘버그 바운티 프로그램’을 통해 보안 연구자들이 새로운 생성형 AI 기을 사용할 수 있도록 하고 있다고 했다.

메타는 규제 당국, 정책 입안자, 전문가와 함께 사람들의 개인정보를 보호할 책임에 대해서도 강조했다.

이들과 협력해 데이터 보호에 대한 높은 기준을 충족하도록 노력하고 있다고 했다. 

메타의 생성AI 제품을 구동하는 모델의 학습에 어떤 데이터 유형이  사용되는지 이해하는 것은 중요하다는 설명이다.

예를 들어, 친구나 가족과의 개인 메시지는 AI 학습 용도로 사용하지 않는다.

그러나 AI 스티커 모델을 개선하기 위해 사용자가 채팅에서 사용할 스티커를 검색하는 등의 AI 스티커 관련 데이터는 활용할 수 있다.

한편, 페이스북과 인스타그램의 모회사 메타는 27일(현지시간) 미 캘리포니아주 멘로파크 본사에서 연례 개발자 콘퍼런스 '메타 커넥트 2023'을 열고 SNS에 특화된 생성형 AI(인공지능)인 '메타 AI'를 공개했다.

'메타 AI'는 인스타그램과 왓츠앱, 메신저 등 메타의 SNS 제품에서 텍스트 입력으로 구동하는 AI 비서다. SNS상에서 상대방과 대화 중 궁금한 내용이 있으면 즉시 대답해준다. '메타 AI'는 미국에서 테스트 버전으로 우선 제공될 예정이다.

저작권자 © 포쓰저널 무단전재 및 재배포 금지