병합 완료: 원격 저장소 최신 변경사항 반영

- 회의시작및실시간회의록작성.puml 병합 완료 - .gitignore 업데이트 - stt-ai 디렉토리 추가 - requirements.txt, .env.example 추가 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
2026-01-21 09:06:23 +00:00 · 2025-10-22 15:24:08 +09:00 · 2025-10-22 15:24:08 +09:00 · 9f15f4f6e5
commit 9f15f4f6e5
parent b05f7b2f22
6 changed files with 176 additions and 80 deletions
--- a/.claude/settings.local.json
+++ b/.claude/settings.local.json
@ -35,7 +35,8 @@
      "Bash(./tools/check-mermaid.sh:*)",
      "Bash(mv:*)",
      "Bash(cp:*)",
-      "mcp__sequential-thinking__sequentialthinking"
+      "mcp__sequential-thinking__sequentialthinking",
+      "Bash(git checkout:*)"
    ],
    "deny": [],
    "ask": []
--- a/.env.example
+++ b/.env.example
@ -0,0 +1,12 @@
+# Azure Speech Service 설정
+AZURE_SPEECH_KEY=your_azure_speech_key_here
+AZURE_SPEECH_REGION=region_here
+
+# OpenAI API (회의록 생성용)
+OPENAI_API_KEY=your_openai_api_key_here
+
+# 개발 환경 설정
+ENVIRONMENT=development
+DEBUG=true
+
+
--- a/.gitignore
+++ b/.gitignore
@ -1,3 +1,4 @@
 .playwright-mcp/
 .DS_Store
 **/.DS_Store
+.env
--- a/design/backend/sequence/outer/회의시작및실시간회의록작성.puml
+++ b/design/backend/sequence/outer/회의시작및실시간회의록작성.puml
@ -1,4 +1,4 @@
-@startuml 회의시작및실시간회의록작성
+@startuml
 !theme mono

 title 회의시작및실시간회의록작성 외부 시퀀스
@ -23,33 +23,18 @@ activate Gateway
 Gateway -> Meeting: POST /meetings/{meetingId}/start
 activate Meeting

-' 회의 세션 생성
-Meeting -> Meeting: 회의 세션 생성\n- 회의 상태 업데이트 (시작중)\n- 시작 시간 기록\n- 회의 통계 초기화
+Meeting -> Meeting: 회의 세션 생성

-' MeetingStarted 이벤트 발행
 Meeting -> EventHub: MeetingStarted 이벤트 발행
 activate EventHub
-note right
-  이벤트 데이터:
-  - meetingId
-  - title
-  - startTime
-  - participants
-end note

 Meeting --> Gateway: 201 Created
-note right
-  응답 데이터:
-  - meetingId
-  - sessionId
-  - status: IN_PROGRESS
-end note
 deactivate Meeting

-Gateway --> Frontend: 201 Created (회의 세션 정보)
+Gateway --> Frontend: 201 Created
 deactivate Gateway

-Frontend -> Frontend: 회의 화면으로 전환\n- 음성 녹음 UI 표시\n- 참석자 목록 표시\n- 회의록 편집 영역 활성화
+Frontend -> Frontend: 회의 화면으로 전환

 Frontend --> User: 회의 진행 화면 표시
 deactivate Frontend
@ -59,7 +44,7 @@ deactivate Frontend
 EventHub -> STT: MeetingStarted 이벤트 구독
 activate STT

-STT -> STT: 음성 녹음 준비\n- 녹음 세션 생성\n- 오디오 스트림 초기화\n- Azure Speech 연동 준비
+STT -> STT: 음성 녹음 준비

 STT --> EventHub: 녹음 준비 완료
 deactivate STT
@ -75,21 +60,10 @@ activate Frontend
 Frontend -> STT: 음성 데이터 스트리밍
 activate STT

-' 음성-텍스트 변환
-STT -> STT: 음성 인식 처리\n- 화자 식별\n- Azure Speech API 호출\n- 텍스트 변환\n- 타임스탬프 기록
+STT -> STT: 음성 인식 처리

-' TranscriptReady 이벤트 발행 (5초 배치)
-STT -> EventHub: TranscriptReady 이벤트 발행 (5초 배치)
+STT -> EventHub: TranscriptReady 이벤트 발행
 activate EventHub
-note right
-  이벤트 데이터:
-  - meetingId
-  - segments:
-    * speaker
-    * text
-    * timestamp
-    * confidence
-end note

 STT --> Frontend: 음성 처리 중 표시
 deactivate STT
@ -100,64 +74,37 @@ deactivate Frontend
 EventHub -> AI: TranscriptReady 이벤트 구독
 activate AI

-par AI 병렬 처리
-    AI -> AI: [1] 회의록 내용 정리 (LLM)\n- 구어체 → 문어체 변환\n- 주제별 분류\n- 핵심 내용 요약\n- 문장 다듬기
-and
-    AI -> AI: [2] 전문용어 추출 (RAG)\n- 전문용어 자동 감지\n- 벡터 임베딩\n- 유사도 검색\n- 맥락 기반 설명 생성
-and
-    AI -> AI: [3] 관련 자료 검색\n- 과거 회의록 검색\n- 사내 문서 검색\n- 관련도 계산\n- 상위 5개 선정
-end
+AI -> AI: [1] 회의록 내용 정리 (LLM)
+AI -> AI: [2] 전문용어 추출 (RAG)
+AI -> AI: [3] 관련 자료 검색

-' AI 분석 결과 저장
-AI -> AI: AI 분석 결과 저장\n- TranscriptSummary 생성\n- TermExplanation 저장\n- 관련 문서 링크 저장
+AI -> AI: AI 분석 결과 저장

-' TranscriptSummaryCreated 이벤트 발행
-AI -> EventHub: TranscriptSummaryCreated 이벤트 발행
-note right
-  이벤트 데이터:
-  - meetingId
-  - summary
-  - terms
-  - relatedDocs
-  - timestamp
-end note
+AI -> EventHub: TranscriptSummaryCreated 발행

 AI --> EventHub: AI 분석 완료
 deactivate AI
-deactivate EventHub

 == 회의록 저장 및 실시간 동기화 ==

-EventHub -> Meeting: TranscriptSummaryCreated 이벤트 구독
-activate EventHub
+EventHub -> Meeting: TranscriptSummaryCreated 구독
 activate Meeting

-' 회의록 데이터 저장
-Meeting -> Meeting: 회의록 데이터 저장\n- Transcript 엔티티 업데이트\n- 버전 증가\n- 수정 이력 기록
+Meeting -> Meeting: 회의록 데이터 저장

-' 캐시 무효화
-Meeting --> Cache: DEL meeting:info:{meetingId}
+Meeting -> Cache: 캐시 무효화
 activate Cache
 Cache --> Meeting: 캐시 삭제 완료
 deactivate Cache

-' 실시간 동기화 (WebSocket)
 Meeting -> Frontend: WebSocket 메시지 전송
 activate Frontend
-note right
-  메시지 데이터:
-  - type: TRANSCRIPT_UPDATE
-  - summary
-  - terms
-  - relatedDocs
-  - delta
-end note

 Meeting --> EventHub: 동기화 완료
 deactivate Meeting
 deactivate EventHub

-Frontend -> Frontend: 회의록 화면 업데이트\n- 정리된 회의록 표시\n- 전문용어 하이라이트\n- 관련 자료 링크 표시\n- 수정자 표시 (3초간)
+Frontend -> Frontend: 회의록 화면 업데이트

 Frontend --> User: 실시간 회의록 표시
 deactivate Frontend
@ -165,16 +112,10 @@ deactivate Frontend
 end

 note over User, EventHub
-**처리 시간**:
+처리 시간:
 - STT 변환: 1-3초
 - AI 병렬 처리: 5-8초
- 회의록 저장 및 동기화: 1-2초
- 총 처리 시간: 7-13초 (5초 배치 기준)
-
-**차별화 포인트**:
- AI 병렬 처리로 회의록 정리, 전문용어 설명, 관련 자료 검색을 동시에 수행
- 정리된 회의록과 맥락 기반 용어 설명을 통합 제공
- WebSocket 델타 전송으로 네트워크 효율성 향상
+- 회의록 저장: 1-2초
+- 총 처리 시간: 7-13초
 end note
-
@enduml
--- a/requirements.txt
+++ b/requirements.txt
@ -0,0 +1,5 @@
+azure-cognitiveservices-speech==1.34.0 # Azure Speech SDK for Python
+python-dotenv==1.0.0 # For loading environment variables from .env file
+
+
+
--- a/stt-ai/tests/stt_test.py
+++ b/stt-ai/tests/stt_test.py
@ -0,0 +1,136 @@
+"""
+Azure Speech SDK 연결 테스트
+- 마이크 입력을 받아 실시간 STT 수행
+- 화자 식별 기능 테스트
+"""
+
+import os
+import azure.cognitiveservices.speech as speechsdk
+from dotenv import load_dotenv
+
+# .env 파일 로드
+load_dotenv()
+
+def test_azure_speech_connection():
+    """Azure Speech 서비스 연결 테스트"""
+    
+    # 환경변수에서 키 읽기
+    speech_key = os.getenv("AZURE_SPEECH_KEY")
+    speech_region = os.getenv("AZURE_SPEECH_REGION")
+    
+    if not speech_key or not speech_region:
+        print("❌ 환경변수가 설정되지 않았습니다!")
+        print("   .env 파일에 AZURE_SPEECH_KEY와 AZURE_SPEECH_REGION을 설정하세요.")
+        return False
+    
+    print(f"🔑 Azure Speech Key: {speech_key[:10]}...")
+    print(f"🌍 Region: {speech_region}")
+    
+    # Speech Config 생성
+    speech_config = speechsdk.SpeechConfig(
+        subscription=speech_key,
+        region=speech_region
+    )
+    speech_config.speech_recognition_language = "ko-KR"
+    
+    # 오디오 설정 (마이크)
+    audio_config = speechsdk.audio.AudioConfig(use_default_microphone=True)
+    
+    # Recognizer 생성
+    recognizer = speechsdk.SpeechRecognizer(
+        speech_config=speech_config,
+        audio_config=audio_config
+    )
+    
+    print("\n🎤 마이크에 대고 말씀하세요 (한국어)...")
+    print("   (음성 인식이 시작됩니다)\n")
+    
+    try:
+        # 한 번의 음성 인식 수행
+        result = recognizer.recognize_once()
+        
+        if result.reason == speechsdk.ResultReason.RecognizedSpeech:
+            print(f"✅ 인식 성공!")
+            print(f"📝 텍스트: {result.text}")
+            return True
+        elif result.reason == speechsdk.ResultReason.NoMatch:
+            print(f"⚠️  음성을 인식하지 못했습니다.")
+            print(f"   세부정보: {result.no_match_details}")
+            return False
+        elif result.reason == speechsdk.ResultReason.Canceled:
+            cancellation = result.cancellation_details
+            print(f"❌ 인식 취소됨: {cancellation.reason}")
+            if cancellation.reason == speechsdk.CancellationReason.Error:
+                print(f"   에러 코드: {cancellation.error_code}")
+                print(f"   에러 메시지: {cancellation.error_details}")
+            return False
+            
+    except Exception as e:
+        print(f"❌ 예외 발생: {e}")
+        return False
+
+
+def test_continuous_recognition():
+    """연속 음성 인식 테스트 (실시간 스트리밍)"""
+    
+    speech_key = os.getenv("AZURE_SPEECH_KEY")
+    speech_region = os.getenv("AZURE_SPEECH_REGION")
+    
+    speech_config = speechsdk.SpeechConfig(
+        subscription=speech_key,
+        region=speech_region
+    )
+    speech_config.speech_recognition_language = "ko-KR"
+    
+    audio_config = speechsdk.audio.AudioConfig(use_default_microphone=True)
+    recognizer = speechsdk.SpeechRecognizer(
+        speech_config=speech_config,
+        audio_config=audio_config
+    )
+    
+    print("\n🔄 연속 음성 인식 테스트 시작...")
+    print("   (Ctrl+C로 종료하세요)\n")
+    
+    # 이벤트 핸들러
+    def recognized_handler(evt):
+        if evt.result.reason == speechsdk.ResultReason.RecognizedSpeech:
+            print(f"✅ [{evt.result.offset/10000000:.1f}s] {evt.result.text}")
+    
+    def canceled_handler(evt):
+        print(f"❌ 취소됨: {evt}")
+    
+    # 이벤트 연결
+    recognizer.recognized.connect(recognized_handler)
+    recognizer.canceled.connect(canceled_handler)
+    
+    # 연속 인식 시작
+    recognizer.start_continuous_recognition()
+    
+    try:
+        # 사용자가 종료할 때까지 대기
+        input("Press Enter to stop...\n")
+    except KeyboardInterrupt:
+        print("\n⏹️  인식 중지 중...")
+    finally:
+        recognizer.stop_continuous_recognition()
+        print("✅ 연속 인식 종료")
+
+
+if __name__ == "__main__":
+    print("=" * 60)
+    print("🎤 Azure Speech SDK 연결 테스트")
+    print("=" * 60)
+    
+    # 1. 기본 연결 테스트
+    print("\n[테스트 1] 기본 음성 인식")
+    success = test_azure_speech_connection()
+    
+    if success:
+        # 2. 연속 인식 테스트
+        response = input("\n연속 인식 테스트를 진행하시겠습니까? (y/n): ")
+        if response.lower() == 'y':
+            test_continuous_recognition()
+    
+    print("\n" + "=" * 60)
+    print("테스트 완료!")
+    print("=" * 60)