Gemini 3 Pro and Antigravity
며칠 전 구글이 제미나이 3 와 Antigravity를 출시했습니다. 이 도구를 이용해서 기존에 만들어서 쓰던 도구를 업데이트 해 보았습니다.
제가 개인적으로 만들어서 사용하고 있는 작은 스크립트가 있습니다. 영어를 연습하려고 운전하는 시간에나, 산책하는 시간에 녹음을 하고 들어보곤 했습니다. 그렇게 녹음하고 듣는것만으로는 조금 아쉬워서, 녹음한 파일을 받아쓰기 (transcribe)하는 프로그램을 만들었습니다. 오픈소스인 Whisper 라이브러리를 이용해서 로컬로 받아쓰기를 했죠. 약간 업무 관련된 용어가 녹음이 되니 받아쓰기가 정확하진 않은데, 그래도 어느정도 만족할만 했습니다.
그러다 받아쓴 내용을 좀 더 간략하게 요약할 순 없을까 생각이 들어서, 구글 제미나이 1.5 flash 를 이용해 요약해주는 기능을 추가했죠. 그러다 2.5 flash로 변경해서 지금까지 잘 써오고 있습니다.
이 프로그램을 새로나온 Antigravity에 불러와서 개선을 해 보고자 했습니다. 일단 기존 프로그램의 불편한 점은, 제가 직접 녹음 파일을 특정 폴더에 옮기고 프로그램을 직접 실행해야 되는 부분이어서, 이걸 개선하게 웹앱을 만들어 달라고 했죠.
Antigravity 툴이 순식간에 플랜을 세우고 리뷰를 요청하더군요. 마치 코드리뷰하듯이 문서에 주석을 달고 리뷰를 하면 그것을 반영해서 작업을 시작합니다. 기존 파이선코드에 맞춰서 백엔드는 파이선으로 디자인을 하고, 프론트엔드는 자바스크립트 (jsx)로 코딩을 해서 업로드 페이지를 순식간에 만들어냈습니다.
기존 프로그램을 분석해서, 여러 파일이 업로드 되면 순차적으로 비동기로 파일을 처리하게 디자인을 바꾸고 직접 테스트까지 자동으로 수행하네요.
그 와중에 새로운 작업을 던져주면, 에이전트를 추가로 실행해서 다른 작업까지 합니다.
그러다 rate limit이 걸리네요. 꽤 잘 코딩해 줘서 프로 라이센스로 업그레이드하려고 했는데, 아직은 AI 프로 라이센스를 가지고 있어도 무료계정과 사용량이 동일하다고 하네요. 아마 Antigravity용 플랜이 따로 나올 것 같아보입니다.
아무튼, 사용제한은 5시간마다 리셋이 된다고 해서, 그걸 몇번 하고 나니, 원하는 기능을 d꽤 많이 추가할 수 있었습니다.
- 여러 음성파일 업로드
- 업로드 된 파일, CC, 요약 보는 페이지
- 리스트 페이지에 달력 추가해서, 오디오 저널이 있는 날짜에 점 찍고 클릭하면 해당 저널을 보여주기
- 저널 리스트에 카테고리와 태그 기능 추가
- 카테고리와 태그 삭제, 수정 기능 추가
- 영상 녹화를 페이지에서 해서 저널 남기는 기능
- 음성만 녹음하는 기능 추가
- 영상이나 음성 녹음 중, 현재까지 녹음된 내용을 기준으로 적절한 다음 질문 화면에 보여주기
이 수많은 변경을 겨우 사흘에서 나흘 사이에 만들어냈습니다. 약간의 비효율적인 부분이 보이긴 한데 제가 혼자 할 때보다 훨씬 빠르네요. 게다가 저는 프론트엔드 웹 디자인을 거의 모르다시피 하니까 이 부분은 제가 건들 수도 없는 부분이구요.

이렇게 앱 하나를 만들어보니, AI가 실감이 꽤 납니다. 회사에서 칩 디자인에서도 AI를 쓰는데, 그때는 제가 잘 아는 분야다보니 AI가 잘 하는 것 보다 못 하는 부분이 더 많이 보였는데, 이번에는 아예 모르는 분야를 맡겨보니, 제 기준에는 신기하기만 합니다. 게다가 제미나이3프로를 쓰면서 더 성능 향상이 많이 되어서 더 크게 다가오는 것 같기도 하고요.
이젠 뭐 이 앱은 더 이상 기능 추가할 것도 없고 그냥 만족하면서 계속 쓸 것 같네요. 개인적으로는 충분하기도 하고요.