목록Project (79)
Allen's 데이터 맛집
이번 프로젝트는 데이터 분석가로서 제 역량을 한 단계 성장시킨 값진 경험이었습니다.1. 데이터를 다룬다는 것의 의미처음 데이터를 접했을 때, 그 안에 숨겨진 패턴과 정보를 찾는다는 것이 얼마나 복잡한 일인지 다시금 깨달았습니다.결측값과 이상치를 정리하며 데이터를 정제하는 과정이 얼마나 중요한지 실감했고, 깨끗한 데이터를 기반으로 분석을 시작하는 것이 프로젝트의 절반 이상을 차지한다는 것을 배웠습니다."데이터는 모든 문제 해결의 시작이다"라는 말이 이번 프로젝트를 통해 더 깊이 와닿았습니다.2. 분석에서 중요한 것은 '소통'이다머신러닝 모델을 구축하고 성능을 높이는 과정 자체도 흥미로웠지만, 그 결과를 직관적으로 전달하는 일이 더 어렵다는 것을 느꼈습니다.데이터 분석가는 단순히 결과를 내는 사람을 넘어, ..
EDA와 데이터 전처리를 기반으로, 공정 데이터를 학습해 품질 상태(정상/불량)를 예측하고, 모델 성능을 평가했습니다.프로젝트의 핵심인 머신러닝 알고리즘과 각 모델의 결과를 구체적으로 살펴보겠습니다.1. 머신러닝 모델 선택 기준이번 프로젝트의 주요 목표는 제조 공정 데이터에서 품질 상태를 정확히 예측하는 것이었습니다.이를 위해 다양한 머신러닝 알고리즘을 비교하고, 최적의 모델을 선정했습니다.사용한 알고리즘선형 회귀(Linear Regression):단순하고 해석이 쉬운 모델로, 변수 간 선형 관계를 학습.의사결정 나무(Decision Tree):비선형 관계를 학습하며, 변수 간의 계층적 분류에 강점.랜덤 포레스트(Random Forest):여러 개의 의사결정 나무를 조합하여 예측 성능을 높이는 앙상블 학..
이번 글에서는 스마트팩토리 제조 데이터 분석 프로젝트의 중요한 첫 단계인 EDA를 다룹니다.데이터 전처리는 머신러닝 모델의 성능을 좌우하는 핵심 과정으로, 데이터를 정리하고 분석 가능한 상태로 만드는 작업입니다.1. 데이터 전처리: 데이터를 다듬는 과정1.1 결측값 처리수집된 제조 공정 데이터는 종종 결측값(missing values)을 포함하고 있습니다.센서 오류, 네트워크 문제 등으로 인해 발생한 결측값을 적절히 처리하지 않으면 분석 결과가 왜곡될 수 있습니다.처리 방법수치형 변수:온도(temperature)와 압력(pressure)의 결측값을 평균값으로 대체.범주형 변수:품질 상태와 같은 범주형 변수는 **가장 빈번히 나타나는 값(모드)**로 대체.# 결측값 처리 예제data['temperature..

이 블로그에서는 CLASS101의 제조 데이터 분석 강의를 기반으로 진행한 프로젝트를 소개합니다.이번 프로젝트는 제조 공정 데이터를 분석하고, 품질 관리 및 공정 최적화를 위한 인사이트를 도출하는 데 중점을 두었습니다. 프로젝트 배경: 왜 제조 공정 데이터인가?제조업은 공정 효율성과 품질 관리가 곧 경쟁력이 되는 산업입니다.특히, 제조 공정 중 발생하는 데이터를 분석하면 불량률 감소, 생산성 향상, 비용 절감이라는 세 가지 주요 목표를 달성할 수 있습니다.이번 프로젝트는 다음과 같은 배경에서 시작되었습니다:데이터 기반 의사결정의 필요성:제조 공정 데이터를 통해 문제를 사전에 발견하고 해결.실시간 품질 관리:센서 데이터를 분석하여 불량률을 줄이고 최적의 공정 조건을 제안.자동화 가능성 탐구:데이터 분석을 ..