pyQT5로 간단히 GUI를 만들어서 meloTTS를 테스트해본 영상입니다. 1660에서 돌린 결과인데 처음 목소리가 나올때까진 모델도 로드해야 해서 시간이 좀 걸리지만 이후에는 바로 목소리가 나오는걸 확인할 수 있습니다.
최초작성 2024. 11. 14
최종작성 2024. 11.
이미지 캡셔닝을 테스트해봅니다. AI가 이미지를 보고 그 내용을 설명하는 글(캡션)을 자동으로 만들어주는 기술입니다.
2025. 4. 30 최초작성
테스트 해보려면 Python 개발 환경을 생성하고 CUDA를 사용할 수 있는 Pytorch를 설치하는게 필요합니다. 자세한
카메라가 빨리 움직일때 SIFT보다 성능이 우수하다고 하는 XFeat를 사용해봤습니다. 지금은 이미지 테스트만 진행한 상황이며 실시간 테스트는 조만간 해보겠습니다.
2024. 7. 28 최초작성
2024. 7. 28 실시간 테스트를 추가했습니다.
참고
https://github.com/verlab/
문장의 유사도를 비교시 사용할 수 있는 Sentence Transformers 사용 방법을 다룹니다.
다음 문서를 기반으로 작성했습니다.
Quickstart
https://www.sbert.net/docs/quickstart.html#comparing-sentence-similarities
2024. 3. 2 최초작성
2025. 1. 5 패키지 설치방법