분류 전체보기
-
페스트 _ 알베르카뮈Personal Story/Book 2022. 5. 1. 16:28
시간이 없고 깊이 생각할 여유가 없어서 사람들은 사랑이 무엇인지 알지도 못한 채 사랑할 수밖에 없는 것이다. p13 남자들과 여자들은 이른바 성행위라고 하는 것 속에 파묻혀서 짧은 시간 동안에 서로를 탕진해 버리거나 아니면 둘만의 기나긴 습관 속에 얽매이는 것이다. 시간이 없고 깊이 생각할 여유가 없어서 사람들은 사랑이 무엇인지 알지도 못한 채 사랑할 수밖에 없는 것이다. p54 ~ 56 사실 재앙이란 모두가 다 같이 겪는 것이지만 그것이 막상 우리의 머리 위에 떨어지면 여간해서는 믿기 어려운 것이 된다. 죽은 사람이란 그 죽은 모습을 눈으로 보았을 때에만 실감이 나는 것이어서, 오랜 역사에 걸쳐서 여기저기 산재하는 일억의 시신들은 상상 속의 한 줄기 연기에 불과한 것이다. 인정해야 할 것이면 명백하게 ..
-
[CS231n] 5. Neural Networks Part 1: Setting up the ArchitectureMachine Learning/CS231n 2022. 4. 29. 02:22
keywords : model of a biological neuron, activation functions, neural net architecture, representational power 1) Biological motivation and connections basic computational unit of the brain is a neuron Model the firing rate of the neuron with an activation function f, which represents the frequency of the spikes along the axon. Historically, a common choice of activation function is the sigmoid ..
-
Vision-Language datasets (COCO, VG, SBU, CC3m, CC12m) 다운로드Machine Learning/Multimodal Learning 2022. 4. 28. 01:40
DALL·E 2, CLIP 등이 놀라운 결과를 보여주며 Multimodal(특히 Vision-Language) 분야에 대한 관심이 증가하고 있습니다. 주어진 텍스트를 기반으로 이미지를 생성하는 모델, 텍스트와 이미지가 공유하는 representation을 추출하는 모델 등 다양한 가능성을 보여주고 있지만, 대용량 데이터와 large-scale 모델을 사용하는 경우가 많아 리소스가 충분하지 않다면 연구가 힘든 상황입니다. 그럼에도 많은 대학원 연구실이나 스타트업에서 앞으로 멀티모달에 대한 연구 및 사업화를 구상할 것이라고 생각되기에, 비교적 데이터 사이즈는 작지만 딥러닝 학습에 도움이 될만한 양질의 dataset들을 list-up하고 다운로드 방법을 공유합니다. 더보기 최근 멀티모달 도메인에서 좋은 성능을..
-
Verifying Vision-Language Alignment with Cross-Attention Map (feat. DINO)Machine Learning/Multimodal Learning 2022. 4. 28. 01:33
최근 Vision Transformer를 self-supervised로 학습하는 방법들이 활발히 연구되고 있습니다. DINO는 그중 하나로 제안한 방법으로 학습한 모델의 self-attention map을 시각화한 결과, 이미지 속 객체를 뚜렷하게 구분하는 것을 확인했습니다. Semantic segmentation 정보를 주지 않았음에도, 아래와 같이 객체를 잘 구분해 많은 관심을 받았습니다. 저자들은 Vision Transformer의 마지막 layer에서 [CLS] 토큰과 다른 patch들 사이의 self-attention map을 시각화했으며, 특정 객체 위치에 해당하는 patch와 다른 patch들 사이를 시각화했을 때도 관련 있는 부분들의 attention이 높았습니다. 자세한 내용은 Emerg..
-
[CS231n] 4. BackpropagationMachine Learning/CS231n 2022. 4. 27. 16:13
Keywords : chain rule interpretation, real-valued circuits, patterns in gradient flow 1) Introduction Intuitive understanding of backpropagation A way of computing gradients of expressions through recursive application of chain rule. Understanding of this process is critical to understand, and effectively develop, design and debug neural networks. Think of the training data as given and fixed, a..
-
[CS231n] 3. OptimizationMachine Learning/CS231n 2022. 4. 27. 15:17
Keyword : Stochastic Gradient Descent 1) Introduction Two key components in context of the image classification task: A (parameterized) score function mapping the raw image pixels to class scores (e.g. a linear function) A loss function that measured the quality of a particular set of parameters based on how well the induced scores agreed with the ground truth labels in the training data.(e.g. S..