본문 바로가기
Project

캡스톤 디자인 - 분석 및 설계

by re-hwi 2024. 4. 21.

먼저 GPT AI 비서의 이름은 '미르' 라고 정했다. 올해가 청룡의 해이기도 하고 미르라는 어감도 좋아서 선택했다. 그동안 중간 발표를 위해서 팀원들과 여러번 만나 미르의 기능에 대해 이야기를 많이 했었다. 

 

내용을 요약하자면 음성인식 및 출력 기능, GPT API를 따온 인공지능, 오늘 날짜와 날씨를 알려주는 기능, 음악 재생 기능 이렇게 4가지를 최우선시 하기로 했다.

 

사실 모든게 다 API 인것 같아서 이렇게 해도 되나 라는 생각이 들었지만 각각의 기능을 조화롭게 묶는 것 또한 개발자의 역량 이라고 생각해서 한결 편하게 진행할 수 있었던 것 같다. ㅋㅋ

 

각각의 기능을 어떻게 구현할지에 대한설명은 다음과 같다. 

음성인식 및 출력 (STT/TTS)

음성인식은 speech_recognition 라이브러리를 사용 할 예정이다. 처음에는 구글 STT API 를 사용하려 했으나 실시간 음성 인식이 필요하기에 해당 라이브러리를 선택했다.

 

예제 코드를 찾아서 실행해 본 결과 음성 인식률은 굉장히 좋았다. 그런데 음성의 끝을 잘 구분하지 못하는 것 같다. 내가 문단을 끝내도 주변 잡음이 있거나 다른 여러 사람이 말하고 있으면 계속해서 인식한다. 이 문제가 프로젝트의 가장 큰 걸림돌이 될거라고 생각한다. 

 

GPT API를 따온 인공지능

유저의 입력을 매개변수로 받고 GPT의 답변을 반환하는 메서드를 만들어 STT 처리가 된 텍스트를 GPT 에 전달한다.

 

오늘 날짜와 날씨를 알려주는 기능

날짜와 날씨 API를 받아서 유저가 날짜 혹은 날씨에 대해 물었을 때 답변할 수 있도록 한다.


일단은 이렇게 먼저 구현을 하기로 했다 더 필요한 기능이 있다면 그때그때 빠르게 이야기 해보고 추가할 생각이다.

반응형

'Project' 카테고리의 다른 글

캡스톤 디자인 - 주제선정  (0) 2024.03.09
티스토리 블로그 꾸미기 (3)  (0) 2024.01.18
티스토리 블로그 꾸미기 (2)  (6) 2024.01.04
티스토리 블로그 꾸미기 (1)  (0) 2024.01.03
[ChatGPT] 명언만들기  (0) 2023.09.18

댓글