숨겨진 마르코프 모델(흠)은 모델링 된 시스템이 관찰되지 않은(즉,숨겨진)상태를 가진 마르코프 프로세스로 가정되는 통계 마르코프 모델입니다.
히든 마르코프 모델은 특히 강화 학습 및 음성,필기,제스처 인식,품사 태그 지정,악보 추적,부분 방전 및 생물 정보학과 같은 시간적 패턴 인식에 적용되는 것으로 알려져 있습니다.
흠
의 용어 숨겨진 용어는 관찰 뒤에 첫 번째 순서 마르코프 과정을 의미한다. 관찰은 우리가 알고 관찰 할 수있는 데이터를 말합니다. 마르코프 프로세스는 아래 다이어그램에서”비가 오는”과”맑은”사이의 상호 작용에 의해 표시되며 이들 각각은 숨겨진 상태입니다.

관찰은 알려진 데이터이며 위의 다이어그램에서”걷기”,”쇼핑”및”청소”를 나타냅니다. 기계 학습 의미에서 관찰은 우리의 훈련 데이터이며 숨겨진 상태의 수는 모델에 대한 우리의 하이퍼 매개 변수입니다. 모델의 평가는 나중에 논의 될 것이다.

상태 전이 확률은 각 숨겨진 상태를 가리키는 화살표입니다.이 상태 전이 확률은 각 숨겨진 상태를 가리키는 화살표입니다. 관측 확률 행렬은 각 숨겨진 상태의 각 관측치를 가리키는 파란색 및 빨간색 화살표입니다. 행렬은 행이 최대 1 을 더한다는 것을 의미하는 행 확률 적입니다.


행렬은 확률이 한 상태로 다른 상태로 이동하거나 한 상태에서 관찰로 이동하는 것을 설명합니다.
초기 상태 분포는 숨겨진 상태에서 시작하여 모델을 가져옵니다.
알려진 상태 전이 확률,관측 확률 행렬 및 초기 상태 분포가 있는 전체 모델은 다음과 같이 표시됩니다,

파이썬에서 위의 모델을 어떻게 구축 할 수 있습니까?
위의 경우 배출량은 개별{“걷기”,”상점”,”깨끗한”}입니다. 이 라이브러리는 그러한 문제를 표준화된 프로그래밍 인터페이스를 제공함으로써 해결합니다. 이 라이브러리는 특정 실행 프로세스에서 불러오거나 실행될 수 있습니다
이제 흠과 함께 해결해야 할 주요 문제는 무엇입니까?
- 문제 1,알려진 모델이 주어지면 서열이 발생할 가능성은 무엇입니까?
- 문제 2,알려진 모델 및 시퀀스가 주어지면 최적의 숨겨진 상태 시퀀스는 무엇입니까? 이것은 날씨가”비가 오는”또는”맑은”
- 문제 3,주어진 시퀀스 오 및 숨겨진 상태의 수,확률을 극대화하는 최적의 모델은 무엇입니까?
파이썬에서 문제 1
첫 번째 관찰이”걷기”인 확률은 초기 상태 분포 및 방출 확률 행렬의 곱셈과 같습니다. 0.6 엑스 0.1+0.4 엑스 0.6=0.30(30%). 로그 우도는 호출에서 제공됩니다.점수.
파이썬에서 문제 2

알려진 모델과 관찰{“상점”,”깨끗한”,”걷기”}을 감안할 때,날씨는~1.5%의 확률로{“비오는”,”비오는”,”써니”}일 가능성이 큽니다.
알려진 모델과 관찰{“깨끗한”,”깨끗한”,”깨끗한”}을 감안할 때 날씨는~3.6%의 확률로{“비오는”,”비오는”,”비오는”}일 가능성이 큽니다.
직관적으로”걷기”가 발생하면 날씨가”비가 오지 않을 것”입니다.
파이썬 문제 3
오디오 파일로 음성 인식:이 단어를 예측

진폭은 흠 관찰로 사용할 수 있지만 기능 엔지니어링은 우리에게 더 많은 성능을 제공 할 것입니다.

오디오 신호에 대한 기능을 생성합니다.
위의 예는 여기에서 가져온 것입니다. 아…아……….. 이 때문에 카일 캐스트너에서 생성한 기능을 엑스테스트로 줄일 수 있습니다.평균(축=2).
이 모델링을 통해 이해하는 데 많은 시간이 걸렸습니다. 나는 목표 변수가 관찰 될 필요가 있다는 인상을 받았다. 이는 시계열에도 해당됩니다. 분류는 각 클래스에 대한 흠을 구축하고 입력에 대한 로그 프로브를 계산하여 출력을 비교하여 수행됩니다.
문제 1 에 대한 수학적 해결책:순방향 알고리즘

알파 패스 관측 및 상태 시퀀스 주어진 모델의 확률이다.

알파 패스 시간(티)=0,초기 상태 분포 에 나는 그리고 거기에서 첫 번째 관찰 영형 0.

시간에 알파 패스(티)=티,각 숨겨진 상태에 대한 마지막 알파 패스의 합에 방출을 곱한 값 구약.

문제 2 에 대한 수학적 해결책: 뒤로 알고리즘




주어진 모델 및 관찰,시간에 상태 제나라에있는 확률.

문제 3 에 대한 수학적 해결책: 전진-후진 알고리즘


확률…에서 상태 제나라…에 시간 티 주어진 모델 및 관찰


모든 전환 확률의 합계 나는…에 제이.


전이 및 방출 확률 행렬은 디 감마로 추정됩니다.이 경우 반복 횟수가 증가 할 수 있습니다.