더북(TheBook)

코드 4-9 음성 인식 예제

const recognizer = SpeechCommands.create('BROWSER_FFT'); ------ 브라우저에 내장된 FFT(Fast Fourier Transform)를 사용한 음성 인식 객체를 만듭니다.
console.log(recognizer.wordLabels());  ------ (‘background-noise’와 ‘unknown’ 레이블을 포함하여) 모델이 인식할 수 있는 단어 레이블을 확인합니다.
const words = recognizer.wordLabels();
recognizer.listen(({scores}) => { ------ 온라인 스트리밍 인식을 시작합니다. 첫 번째 매개변수는 콜백입니다. 이 콜백은 배경 잡음이나 알 수 없는 단어를 제외한 단어의 확률이 어떤 임계값(여기서는 0.75) 이상일 때 호출됩니다.
  // 점수를 (점수, 단어) 쌍의 리스트로 변환합니다
  scores = Array.from(scores).map((s, i) => ({score: s, word: words[i]}));

  // 가장 높은 확률의 단어를 찾습니다
  scores.sort((s1, s2) => s2.score - s1.score); ------ 가장 높은 점수를 가진 단어의 인덱스를 찾습니다. 
  document.querySelector('#console').textContent = scores[0].word;
}, {probabilityThreshold: 0.75});
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.