본문 바로가기

분류 전체보기6

🐼 판다스(Pandas) 기초 살펴보기 : 전기차 데이터 실습 안녕하세요! 데이터 분석의 가장 강력한 도구 중 하나인 **판다스(Pandas)**를 활용하여 실제 데이터를 분석하는 방법을 단계별로 자세히 알아보겠습니다. 이번 강의는 데이터 분석의 전 과정을 한 번에 따라 할 수 있도록 구성되었습니다. 구글 코랩(Colab) 환경을 기준으로 작성되었습니다.1. 데이터 분석의 첫 단계: 데이터 다운로드 및 로딩가장 먼저, 분석에 사용할 데이터를 준비해야 합니다. 캐글(Kaggle)에서 데이터를 다운로드하고, 판다스의 핵심 객체인 데이터프레임(DataFrame)으로 불러오는 과정을 진행합니다. 아래 코드를 그대로 복사하여 코랩에 붙여넣어 주세요. import kagglehubimport shutilimport os# 최신 버전 다운로드path = kagglehub.dat.. 2025. 8. 22.
스크랩핑과 크롤링 웹 스크래핑 (Web Scraping) 웹 스크래핑은 웹 사이트의 HTML 코드에서 데이터를 추출하는 과정을 의미합니다. 이것은 보통 웹 페이지의 특정 부분에서 정보를 수집하는 작업입니다. 예를 들어, 특정 웹 페이지에서 제품 가격, 뉴스 기사, 블로그 게시물 등을 수집하고 해당 정보를 데이터베이스에 저장하거나 분석에 사용할 수 있습니다. BeautifulSoup과 같은 라이브러리를 사용하여 특정 HTML 요소를 선택하고 데이터를 추출하는 것이 일반적입니다. 웹 크롤링 (Web Crawling) 웹 크롤링은 자동화된 방식으로 웹을 탐색하고 정보를 수집하는 프로세스를 의미합니다. 크롤러 또는 스파이더라고도 불리는 프로그램이 시작 URL에서 출발하여 하이퍼링크를 따라 웹 사이트를 탐색하고 웹 페이지의 내용을.. 2024. 4. 16.
대학원 Q&A는 댓글 대학원 입학, 연구, 생활 관련 질문 사항이있으시다면 댓글로 달아주시면 도와드리겠습니다. 가끔가다 대학원 입학, 연구, 생활에 관한 팁이나 정보가 있다면 글로 작성해드리겠습니다. 2024. 4. 15.
강아지 사진 구분하기 강아지 사진 구분 2가지 방법을 소개 1번 방법_ VGG16모델을 활용하여 구분 2번 방법_ ResNet50모델을 활용하여 구분 입력 데이터 VGG16란? Oxford Visual Geometry Group(일명 VGG)에서 개발한 Convolutional Neural Network(CNN) 아키텍처 중 하나 - VGG16은 16개의 계층(layers)로 구성되어 있으며, 주로 이미지 분류 및 객체 인식 작업에 사용 - 이 아키텍처는 간단하고 일관된 구조로 이루어져 있어 이해하기 쉽고, 많은 컴퓨터 비전 태스크에서 좋은 성능 pip install tensorflow numpy import tensorflow as tf from tensorflow.keras.preprocessing import image.. 2024. 4. 15.