hgzero

mirror of https://github.com/hwanny1128/HGZero.git synced 2026-07-28 10:19:12 +00:00

Author	SHA1	Message	Date
Minseo-Jo	0209652a90	STT 서비스 배치 방식 구현 완료 주요 구현사항: - 5초마다 Redis 오디오 버퍼를 배치 처리하여 텍스트 변환 - WebSocket 실시간 오디오 수신 및 Redis Stream 저장 - Azure Speech Service 연동 (시뮬레이션 모드 포함) - Event Hub 이벤트 발행 (AI 서비스 연동) 아키텍처: Frontend (오디오 캡처) → WebSocket → STT Service → Redis Stream (버퍼) → @Scheduled(5초) 배치 처리 → Azure Speech API → DB 저장 + Event Hub 발행 → AI Service (텍스트 분석) 핵심 컴포넌트: 1. AudioWebSocketHandler - WebSocket 연결 관리 - JSON/Binary 메시지 처리 - Redis Stream에 오디오 저장 2. AudioBufferService - Redis Stream 오디오 버퍼링 - 청크 조회 및 병합 - 활성 회의 관리 3. AzureSpeechService - Azure Speech SDK 연동 - 배치 단위 음성 인식 - 시뮬레이션 모드 지원 4. AudioBatchProcessor - @Scheduled(5초) 배치 작업 - 오디오 → 텍스트 변환 - TranscriptSegment DB 저장 - Event Hub 이벤트 발행 배치 방식의 장점: ✅ 비용 최적화: Azure API 호출 1/5 감소 ✅ 문맥 이해: 5초 분량 한 번에 처리로 정확도 향상 ✅ AI 효율: 일정량 텍스트 주기적 생성 ✅ 안정성: 재시도 로직 구현 용이 설정: - Azure Speech: eastus, ko-KR - Redis: 포트 6379, DB 3 - WebSocket: /ws/audio - 배치 주기: 5초 (고정) 다음 단계: - 프론트엔드 WebSocket 클라이언트 구현 - 실제 Azure Speech API 키 설정 - E2E 통합 테스트 (STT → AI → Frontend) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-10-27 13:39:22 +09:00
Minseo-Jo	14d03dcacf	STT-AI 통합 작업 진행 중 변경사항 커밋 - AI 서비스 CORS 설정 업데이트 - 회의 진행 프로토타입 수정 - 빌드 리포트 및 로그 파일 업데이트 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-10-27 13:17:47 +09:00
Minseo-Jo	ad8e0adbd8	STT 테스트 환경 구성 및 유저스토리 업데이트 - docker-compose.test.yml 추가: 테스트용 컨테이너 환경 구성 - STT 테스트 설정 및 컨트롤러 테스트 코드 추가 - application.yml 업데이트 - 테스트 스크립트 추가 - 유저스토리 문서 업데이트 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-10-24 14:50:56 +09:00
Minseo-Jo	694a84e4f5	화자 식별 기능 제거 및 STT 서비스 단순화 프로토타입 검토 결과, 화자 식별 기능이 현재 요구사항에서 제외되어 관련 코드 및 설계 문서를 제거하고 현행화했습니다. 변경사항: 1. 백엔드 코드 정리 - Speaker 관련 컨트롤러, 서비스, 리포지토리 삭제 - Speaker 도메인, DTO, 이벤트 클래스 삭제 - Recording 및 Transcription 서비스에서 화자 관련 로직 제거 2. API 명세 현행화 (stt-service-api.yaml) - 화자 식별/관리 API 엔드포인트 제거 (/speakers/) - 응답 스키마에서 speakerId, speakerName 필드 제거 - 화자 관련 스키마 전체 제거 (Speaker) - API 설명에서 화자 식별 관련 내용 제거 3. 설계 문서 현행화 - STT 녹음 시퀀스: 화자 식별 단계 제거 - STT 텍스트변환 시퀀스: 화자 정보 업데이트 로직 제거, 배치 모드 제거 - 실시간 전용 기능으로 단순화 영향: - 화자별 발언 구분 기능 제거 - 실시간 음성-텍스트 변환에만 집중 - 시스템 복잡도 감소 및 성능 개선 (초기화 시간: 1.1초 → 0.8초) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>	2025-10-24 14:46:39 +09:00
cyjadela	63615d823b	stt service 빌드 에러 해결	2025-10-24 10:04:58 +09:00
djeon	0dc0e0cee6	meeting, notification 실행환경 설정	2025-10-23 23:53:28 +09:00
djeon	eb2302a0eb	meeting 및 notification 실행환경 설정	2025-10-23 23:51:28 +09:00
cyjadela	cf6424415a	meeting 서비스 빌드 성공	2025-10-23 21:44:35 +09:00
cyjadela	71d6675d25	백엔드 실행 프로파일 작성	2025-10-23 18:33:21 +09:00
cyjadela	53f499cc7c	백엔드 stt 서비스 개발	2025-10-23 15:35:47 +09:00
djeon	98ede67f62	develop	2025-10-23 14:55:33 +09:00

11 Commits