목록Project/반도체 제조&공정 데이터 분석 (3)
Allen's 데이터 맛집
EDA와 데이터 전처리를 기반으로, 공정 데이터를 학습해 품질 상태(정상/불량)를 예측하고, 모델 성능을 평가했습니다.프로젝트의 핵심인 머신러닝 알고리즘과 각 모델의 결과를 구체적으로 살펴보겠습니다.1. 머신러닝 모델 선택 기준이번 프로젝트의 주요 목표는 제조 공정 데이터에서 품질 상태를 정확히 예측하는 것이었습니다.이를 위해 다양한 머신러닝 알고리즘을 비교하고, 최적의 모델을 선정했습니다.사용한 알고리즘선형 회귀(Linear Regression):단순하고 해석이 쉬운 모델로, 변수 간 선형 관계를 학습.의사결정 나무(Decision Tree):비선형 관계를 학습하며, 변수 간의 계층적 분류에 강점.랜덤 포레스트(Random Forest):여러 개의 의사결정 나무를 조합하여 예측 성능을 높이는 앙상블 학..
이번 글에서는 스마트팩토리 제조 데이터 분석 프로젝트의 중요한 첫 단계인 EDA를 다룹니다.데이터 전처리는 머신러닝 모델의 성능을 좌우하는 핵심 과정으로, 데이터를 정리하고 분석 가능한 상태로 만드는 작업입니다.1. 데이터 전처리: 데이터를 다듬는 과정1.1 결측값 처리수집된 제조 공정 데이터는 종종 결측값(missing values)을 포함하고 있습니다.센서 오류, 네트워크 문제 등으로 인해 발생한 결측값을 적절히 처리하지 않으면 분석 결과가 왜곡될 수 있습니다.처리 방법수치형 변수:온도(temperature)와 압력(pressure)의 결측값을 평균값으로 대체.범주형 변수:품질 상태와 같은 범주형 변수는 **가장 빈번히 나타나는 값(모드)**로 대체.# 결측값 처리 예제data['temperature..

이 블로그에서는 CLASS101의 제조 데이터 분석 강의를 기반으로 진행한 프로젝트를 소개합니다.이번 프로젝트는 제조 공정 데이터를 분석하고, 품질 관리 및 공정 최적화를 위한 인사이트를 도출하는 데 중점을 두었습니다. 프로젝트 배경: 왜 제조 공정 데이터인가?제조업은 공정 효율성과 품질 관리가 곧 경쟁력이 되는 산업입니다.특히, 제조 공정 중 발생하는 데이터를 분석하면 불량률 감소, 생산성 향상, 비용 절감이라는 세 가지 주요 목표를 달성할 수 있습니다.이번 프로젝트는 다음과 같은 배경에서 시작되었습니다:데이터 기반 의사결정의 필요성:제조 공정 데이터를 통해 문제를 사전에 발견하고 해결.실시간 품질 관리:센서 데이터를 분석하여 불량률을 줄이고 최적의 공정 조건을 제안.자동화 가능성 탐구:데이터 분석을 ..