2024년 5월 14일, Google은 캘리포니아 마운틴뷰의 쇼어라인 앰피시어터에서 Google I/O 2024 행사를 개최했습니다. 구글 랩스의 부사장인 조쉬 우드워드(Josh Woodward)는 행사에서 제미나이(Gemini) AI 모델의 발전과 새로운 기능을 소개했습니다.
조쉬 우드워드는 제미나이 나노(Gemini Nano)가 안드로이드 폰에서 직접 실행되는 것을 설명하며, 이를 통해 개발자들이 다양한 크기의 멀티모달 제미나이모델을 사용할 수 있게 되었다고 강조했습니다. 현재 제미나이 1.5 Pro와 새로운 1.5 플래쉬 모델이 전 세계 200여 개국에서 이용 가능하며, AI 스튜디오와 버탁스 AI(Vertex AI)를 통해 접근할 수 있습니다. 이 모델들은 텍스트, 이미지, 오디오, 비디오를 입력으로 받아들이며, 최대 100만 개의 토큰을 처리할 수 있습니다. 또한, AI 스튜디오를 통해 200만 개의 토큰 컨텍스트 윈도우를 시험해볼 수 있습니다.
1.5 Pro 모델은 복잡한 작업에 적합하며, 높은 품질의 응답을 제공합니다. 반면, 1.5 플래쉬는 빠른 응답 속도가 중요한 작업에 적합합니다. 개발자들은 AI 스튜디오에서 이 모델들을 쉽게 테스트하고, 필요에 따라 API 키를 생성하거나 코드 설정을 적용할 수 있습니다. 1.5 Pro는 100만 토큰당 7달러, 1.5 플래쉬는 0.35달러의 비용으로 제공됩니다.
또한, Josh는 새로운 개발자 기능들을 소개했습니다. 비디오 프레임 추출, 병렬 함수 호출, 컨텍스트 캐싱 기능이 추가되어 긴 컨텍스트를 더욱 유용하고 경제적으로 활용할 수 있게 되었습니다. 이러한 기능들은 다음 달부터 제공될 예정입니다.
조쉬는 이어서 오픈 모델 패밀리인 젬마(Gemma)에 대해 소개했습니다. 젬마는 7B 및 2B 크기의 경량 모델로 제공되며, 이미지 캡션 생성, 시각적 Q&A 등 다양한 작업에 최적화된 팔리젬마(PaliGemma) 모델이 새롭게 추가되었습니다. 또한, 젬마 2 모델이 6월에 출시될 예정이며, 새로운 27억 파라미터 모델이 추가되어 더 높은 성능을 제공합니다.
마지막으로, 조쉬는 인도의 개발자들이 Gemma 모델을 사용하여 나바라사(Navarasa) 프로젝트를 통해 15개의 인도 언어로 접근성을 확장한 사례를 소개했습니다. 이 프로젝트는 구글의 목표인 전 세계 7,000개 이상의 언어로 정보를 제공하는 데 기여하고 있습니다. 나바라사는 인도 전역의 사람들이 모국어로 대화하고 응답을 받을 수 있도록 돕고 있습니다.
이번 발표는 AI 기술의 발전과 이를 통한 사용자 경험의 혁신을 강조하며, 개발자들이 제미나이와 젬마 모델을 활용하여 더 나은 애플리케이션을 개발할 수 있도록 지원하는 데 중점을 두었습니다.
관련 포스트
Google I/O 2024, 2023년과 비교하여 무엇이 진화했는가?
Google I/O 2024, 순다 피차이 오프닝 요약