모각코

Daiv 모각코 #6

blummerhen 2024. 8. 17. 23:33

1주차

화자 인식(Speaker Recognition) 에서 화자 식별(Speaker Identification)을 맡아 공부를 하고 코드를 작성하는 활동을 6주 동안 진행했습니다. 초기에는 화자 식별이 무엇인지, 화자 식별이 어떤 식으로 이루어지는 지를 공부했습니다.

2주차,3주차

이후 PyTorch를 공부하면서 공식 커뮤니티 사이트에 등록되어있는 'PyTorch로 딥러닝하기' 문서를 이용해 torchvision에 

등록되어있는 CIFAR10 데이터셋을 이용해 이미지 Classification 딥러닝 모델을 만들고 테스트 했습니다.

4주차,5주차

Classification 모델을 만들 떄에 사용한 신경망 모델을 조금 수정을 거쳐 오디오 학습 모델에도 사용했습니다.

오디오 데이터를 Librosa 라이브러리의 librosa.feature.mfcc 를 이용해 mfcc로 변환하고 json라벨링 데이터를 이용하여 각 mfcc에 맞는 라벨을 매칭시켜주는 과정을 거쳐 이전에 사용한 신경망 모델에 학습시켜 정확도를 테스트하는 활동을 하였습니다. 하지만 AI HUB에서 제공받은 샘플 데이터에는 Gender항목이 여성인 것 밖에 없었고 Age 항목도 20~59 등 범위가 넓게 되어있어 mapping하는데 어려움을 겪었습니다.

https://www.aihub.or.kr/aihubdata/data/list.do?currMenu=115&topMenu=100&searchKeyword=%EC%9E%90%EC%97%B0%EC%96%B4

 

AI-Hub

AI허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축 (2023)

www.aihub.or.kr

 

'모각코' 카테고리의 다른 글

Daiv 모각코 #5  (0) 2024.08.15
Daiv 모각코 #4 v2  (0) 2024.07.31
모각코 #3 v2  (0) 2024.07.21
Daiv 모각코 #2 v2  (0) 2024.07.14
Daiv 모각코 #1 v2  (2) 2024.07.14