Research on AI

AI 문제풀이와 실전 데이터 분석을 정리하는 공간입니다. 기초부터 대회까지, 함께 성장해요! 🚀

전체 글 12

[히든 jpop 추천] Benlou - 煙 (연기) : 흐릿한 잔상속에서 퍼지는..

듣다가,, 갑자기 꽂혀버린 노래입니다.공식 뮤비의 조회수가 1.3만회밖에 안되는 진짜 HIDDEN 명곡! 기분이 이도저도 아니고, 뭘 해야할지도 모르는 그런 때에,자동재생된 이 곡만큼 내 기분을 대변해 줄만한 곡이 있을까 생각이 들 정도에요!見慣れた部屋の窓に映るその景色は晴れない (미나레타 헤야노 마도니 우츠루 소노 케시키와 하레나이)익숙한 방 창문에 비치는 그 풍경은 개지 않네 途切れた雲の隙間から星のない空を見上げてる (토기레타 쿠모노 스키마카라 호시노 나이 소라오 미아게테루)끊어진 구름 사이로 별 하나 없는 하늘을 올려다보네 ざわめき始めた午後のため息が滲むにわか雨 (자와메키 하지메타 고고노 타메이키가 니지무 니와카아메)웅성거리기 시작한 오후의 한숨이 번지는 갑작스러운 비 夢から覚めないまま歩く退屈な日々の中 ..

음악/jpop 2025.06.05

[Kaggle] LMSYS Chatbot Arena - 최고의 챗봇 선택하기 ( Chat gpt? Gemini? Grok? 누가 승자일까? )

🥇🆚🥈 LMSYS Chatbot Arena - 최고의 챗봇 선택하기이번글은 좀 다르게 좀 길어지더라도 글이 끊어지지 않고 전체 flow를 한 글에 정리해보려고 합니다!https://www.kaggle.com/code/addisonhoward/lmsys-kerasnlp-starter LMSYS: KerasNLP StarterExplore and run machine learning code with Kaggle Notebooks | Using data from multiple data sourceswww.kaggle.com코드는 해당 노트북을 보며 공부했습니다. A. "LMSYS Chatbot Arena" 대회란 무엇일까요?Kaggle의 "LMSYS Chatbot Arena" 대회는 사용자들이 두 ..

캐글 스터디 2025.05.25

[Kaggle] Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 3. 모델 평가

🔢 Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 3. 모델 평가이번 글은 간단하게 저번글에서 만든 모델을 평가해보도록 하겠습니다.📚 시리즈 전체 목차1. 데이터 준비2. CNN 모델 구현3. 모델 평가 및 시각화🔎 글 개요모델의 성능을 확인하는 대표적인 방법인 Confusion Matrix와 오분류 사례 시각화를 통해 모델이 어떤 숫자에서 실수하는지 살펴보겠습니다.🗂️ 글 내부 목차1. 모델 평가 및 시각화1.1 Confusion Matrix1.2 Plot Error Preds 1. 모델 평가 및 시각화CNN 모델을 직접 평가하고 결과를 시각화 합시다. 저번글 마지막 섹션과 이어집니다. ( 모델 학습 파트에 넣었지만, 사실은 평가 파트로 보는게 합당합..

캐글 스터디 2025.05.10

[Kaggle] Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 2. CNN 모델 구현

🔢 Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 2. CNN 모델 구현이번 글에서는 저번 글에서 전처리한 이미지들로 학습을 시킬 CNN을 자세한 설명과 함께 만들어 보겠습니다. 📚 시리즈 전체 목차1. 데이터 준비2. CNN 모델 구현3. 모델 평가 및 시각화🔎 글 개요CNN 모델 설계 및 컴파일을 함께 할 것입니다.🗂️ 글 내부 목차1. 모델 설계 및 컴파일1.1. Sequential 모델 설계1.2. 레이어별 설명1.3. model.compile() (optimizer, loss, metrics)2. 모델 학습2.1. model.fit()2.2. 콜백 (ReduceLROnPlateau, EarlyStopping)2.3. 학습 로그 및 시각화1. 모..

캐글 스터디 2025.05.06

[jpop 추천] Musica - Brandy Senki

진짜진짜 레전드 맛잇는 곡입니다. 틀어놓고 보세요!!한국어 자막이 있다!! (자막 틀고 볼때랑, 자막 없이 볼때랑 느낌이 매우 달랐으니 자막 안보고 들어보는걸 추천~)Brandy Senki 는 누구지?요즘들어 jpop에 많이 빠지게 되었다. 가사를 알 수 없지만, 그저 흘러나오는 멜로디와 일본어의 조화가 아름답게 들리기 시작했기 때문이다.아이묭, 요네즈 켄시 등 여러 곡을 들으며, 진짜 좋은 곡이 많다는 걸 알게 되었고 결국 이 곡까지 흘러들어오게 되었다.이 곡을 처음 접한 계기는 이 플레이리스트를 들으면서 였다. (강추하는 채널, 강추하는 플레이리스트들!!) 𝗣𝗹𝗮𝘆𝗹𝗶𝘀𝘁 인생은 어디로 흘러가는 건가요이 플레이리스트의 첫 곡인 Musica - Brandy Senki 는 가사의 뜻을 모르..

음악/jpop 2025.04.20

[Kaggle] Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 1. 데이터 준비

🔢 Digit Recognizer Competition : 손글씨 숫자 분류 모델 만들기 - 1. 데이터 준비이 글은 Kaggle의 Digit Recognizer Competition을 통해, 컴퓨터 비전의 기초를 실제 데이터와 함께 익히려는 분들을 위한 튜토리얼입니다. Python 또는 R에 익숙하고 머신러닝 기초를 쌓아가는 중인 분들에게 특히 유용할 것이라고 생각합니다. 이번 대회의 주인공은 MNIST(Mixed National Institute of Standards and Technology) 데이터셋입니다.(예시)이는 수많은 머신러닝 입문자들이 처음 접하게 되는 컴퓨터 비전용 데이터셋으로, "딥러닝의 Hello World"로도 불릴 만큼 널리 쓰이고 있습니다. 각 이미지는 28x28 크기의 ..

캐글 스터디 2025.04.16

[Kaggle] Housing Prices Competition 를 함께 공부하자! - 4. 모델링 및 앙상블

🏡 Housing Prices Competition 문제풀이 - 4. 모델링 및 앙상블모델링 및 앙상블은 다양한 머신러닝 기법을 활용하여 예측 성능을 극대화하는 과정입니다. 이 글에서는 주택 가격 예측을 위한 모델링 전략을 살펴보고, 여러 모델을 조합하는 앙상블 기법을 통해 보다 안정적이고 정확한 예측을 도출하는 방법을 소개합니다.📚 시리즈 전체 목차1. 데이터 이해2. 데이터 전처리3. Feature Engineering4. 모델링 및 앙상블🔎 글 개요이 글에서는 모델링과 앙상블 기법을 중심으로 주택 가격 예측의 성능을 향상시키는 방법을 다룹니다. 먼저, 훈련 데이터를 안정적으로 학습시키기 위한 데이터 스케일링 기법을 적용하고, 이후 XGBoost, LightGBM, CatBoost 등의 대표적인..

캐글 스터디 2025.04.13

[Kaggle] Housing Prices Competition 를 함께 공부하자! - 3. Feature Engineering

🏡 Housing Prices Competition 문제풀이 - 3. Feature Engineering피처 엔지니어링은 타겟 변수인 SalePrice를 보다 정확하게 예측할 수 있도록, 기존 데이터를 바탕으로 새로운 피처(변수)를 생성하는 과정입니다. 이 글에서는 주택 관련 도메인 지식을 바탕으로, 예측에 도움이 될 수 있는 새로운 피처들을 만들어보겠습니다.📚 시리즈 전체 목차1. 데이터 이해2. 데이터 전처리3. Feature Engineering4. 모델링 및 앙상블🔎 글 개요이 글에서는 주택 가격 예측 성능을 높이기 위해, 도메인 지식을 바탕으로 의미 있는 새로운 피처를 생성하고 이를 데이터에 반영하는 과정을 소개합니다.🗂️ 글 내부 목차1. 추가 피처 생성2. 이진 피처 생성3. 범주형 ..

캐글 스터디 2025.04.12

[Kaggle] Housing Prices Competition 를 함께 공부하자! - 2. 데이터 전처리

🏡 Housing Prices Competition 문제풀이 - 2. 데이터 처리데이터 분석을 통해 중요한 통찰을 얻은 후, 이를 바탕으로 머신러닝 모델이 학습할 수 있도록 데이터를 깔끔하게 정리해야 합니다. 단지 보기 좋은 그래프를 만들 기 위해, 시각화와 분석을 진행하는 것이 아니라, 전처리에 필수적입니다. 이 글에서는 전처리(Preprocessing)의 핵심 단계들을 다룹니다.📚 시리즈 전체 목차1. 데이터 이해2. 데이터 전처리3. Feature Engineering4. 모델링 및 앙상블🔎 글 개요모델 학습 전에 데이터를 정제하고 구성하는 작업은 필수입니다. 이 글에서는 결측치 처리, 이상치 제거, 불필요한 변수 제거, 그리고 순서형 변수 인코딩까지 머신러닝에 적합한 형태로 데이터를 다듬는 ..

캐글 스터디 2025.04.09

[Kaggle] Housing Prices Competition 를 함께 공부하자! - 1. 데이터 이해

🏡 Housing Prices Competition 문제풀이 - 1. 데이터 이해이 글은 Kaggle의 인기 대회인 "Housing Prices - Advanced Regression Techniques" 문제를 따라가며, 데이터 분석의 전 과정을 정리하는 시리즈의 첫 번째 포스팅입니다. 원본 코드 출처는 이곳 입니다. 해당 노트북을 직접 따라하고, 리뷰하면서 이 블로그 글을 완성하겠습니다.📚 시리즈 전체 목차1. 데이터 이해2. 데이터 전처리3. Feature Engineering4. 모델링 및 앙상블🔎 글 개요미국 아이오와 주 에임스(Ames)의 주택 데이터를 기반으로, 주택 가격 예측을 위한 데이터 분석 과정을 단계별로 설명합니다.이번 포스트에서는 데이터 불러오기, 통합, 그리고 변수별 특..

캐글 스터디 2025.04.05
목차로 가기