개요 페이스북이 발표한 SAM 관련한 데모를 둘러보던 중 개념을 듣게 되어 정리함 이미지 임베딩(Image Embedding)이란 이미지를 저차원 공간에 수학적으로 표현한 것을 말한다. 신경망에 이미지를 넣어주고 특정 레이어에서의 출력을 임베딩으로 하는 것이다. 이러한 임베딩은 이미지의 특정하고, 중요한 feature를 잡아낸 것이라 보면 된다. 압축된 형태이기에 처리하기에 쉽고 빠르다. 이미지 임베딩은 심지어 NLP(Natural Language Processing)에서도 쓸 수 있는데 이미지와 이미지에 대응하는 문장 표현을 동일한 잠재적인 공간(latent space)에 임베딩할 수 있게 되는 것이다. ChatGPT 결과 prompt: What is an image embedding? An image..
다룰 내용 - 지난 포스팅에서는 설치, 다운로드 해야할 것들을 정리해 둠 - 이번에는 Visual Studio 설정 후 빌드하기와 - 실시간 스트리밍, 동영상에서 object detection 을 해보겠음 visual studio 설정 및 빌드 - 다양한 경우에 대한 설정, 빌드 방법은 깃헙의 원문을 참조할 것 - README 에 상세히 설명되어 있음: https://github.com/AlexeyAB/darknet/ → 저도 시행착오를 거쳐 동작시킨 후 다시 기억을 더듬어 적는 것이다 보니, 따라하시다 막히시거나 추가로 설정해야 하는 부분을 찾으시면 댓글 달아주시면 큰 도움 되겠습니다. 1) darknet.sln 실행 - github 에서 다운로드 받은 darknet 소스에서 darknet.sln 실행..
목표 - 윈도우에서 yolo v3를 설치한 다음 - 웹캠 실시간 영상을 object detection 해보고 - 동영상을 object detection 해보자 윈도우 7에 yolo v3 설치 설치할 것들, 가져올 것들 1. 윈도우용 소스 - 추후 weight 필요함 2. CUDA 3. cuDNN 4. OpenCV 1/4. 윈도우용 소스 내려받기 - 윈도우용 깃헙: https://github.com/AlexeyAB/darknet/ - git clone 으로 내려받으면 된다. 2/4. CUDA 설치하기 - 본인의 GPU에 맞는 CUDA SDK 버전을 설치하여야 한다. (아래에 제 설치 케이스를 정리해둡니다.) 1) 현재 노트북 GPU 확인 (nVidia GTX 960M) - GeForce GTX 960M의 ..
- Total
- Today
- Yesterday
- clean agile
- 오블완
- go
- agile
- 엉클 밥
- 티스토리챌린지
- 영화
- solid
- 체호프
- 인텔리제이
- intellij
- OpenAI
- strange
- 노션
- bun
- 독서후기
- 2023
- websocket
- golang
- notion
- folklore
- 제이펍
- 클린 애자일
- Gin
- github
- 잡학툰
- API
- 독서
- ChatGPT
- Bug
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |