목록데이터과학 (16)
Allen's 데이터 맛집
EDA와 데이터 전처리를 기반으로, 공정 데이터를 학습해 품질 상태(정상/불량)를 예측하고, 모델 성능을 평가했습니다.프로젝트의 핵심인 머신러닝 알고리즘과 각 모델의 결과를 구체적으로 살펴보겠습니다.1. 머신러닝 모델 선택 기준이번 프로젝트의 주요 목표는 제조 공정 데이터에서 품질 상태를 정확히 예측하는 것이었습니다.이를 위해 다양한 머신러닝 알고리즘을 비교하고, 최적의 모델을 선정했습니다.사용한 알고리즘선형 회귀(Linear Regression):단순하고 해석이 쉬운 모델로, 변수 간 선형 관계를 학습.의사결정 나무(Decision Tree):비선형 관계를 학습하며, 변수 간의 계층적 분류에 강점.랜덤 포레스트(Random Forest):여러 개의 의사결정 나무를 조합하여 예측 성능을 높이는 앙상블 학..
이번 글에서는 스마트팩토리 제조 데이터 분석 프로젝트의 중요한 첫 단계인 EDA를 다룹니다.데이터 전처리는 머신러닝 모델의 성능을 좌우하는 핵심 과정으로, 데이터를 정리하고 분석 가능한 상태로 만드는 작업입니다.1. 데이터 전처리: 데이터를 다듬는 과정1.1 결측값 처리수집된 제조 공정 데이터는 종종 결측값(missing values)을 포함하고 있습니다.센서 오류, 네트워크 문제 등으로 인해 발생한 결측값을 적절히 처리하지 않으면 분석 결과가 왜곡될 수 있습니다.처리 방법수치형 변수:온도(temperature)와 압력(pressure)의 결측값을 평균값으로 대체.범주형 변수:품질 상태와 같은 범주형 변수는 **가장 빈번히 나타나는 값(모드)**로 대체.# 결측값 처리 예제data['temperature..

이 블로그에서는 CLASS101의 제조 데이터 분석 강의를 기반으로 진행한 프로젝트를 소개합니다.이번 프로젝트는 제조 공정 데이터를 분석하고, 품질 관리 및 공정 최적화를 위한 인사이트를 도출하는 데 중점을 두었습니다. 프로젝트 배경: 왜 제조 공정 데이터인가?제조업은 공정 효율성과 품질 관리가 곧 경쟁력이 되는 산업입니다.특히, 제조 공정 중 발생하는 데이터를 분석하면 불량률 감소, 생산성 향상, 비용 절감이라는 세 가지 주요 목표를 달성할 수 있습니다.이번 프로젝트는 다음과 같은 배경에서 시작되었습니다:데이터 기반 의사결정의 필요성:제조 공정 데이터를 통해 문제를 사전에 발견하고 해결.실시간 품질 관리:센서 데이터를 분석하여 불량률을 줄이고 최적의 공정 조건을 제안.자동화 가능성 탐구:데이터 분석을 ..
회전기계 고장유형 AI 데이터 분석 프로젝트의 최종 결과와, 이를 통해 얻은 인사이트를 공유합니다.프로젝트의 목표였던 고장 유형 예측과 관련하여 머신러닝 모델의 성과를 정리하고, 분석 결과를 바탕으로 도출한 주요 발견과 적용 가능성을 소개하겠습니다.1. 프로젝트 성과: AI 모델의 고장 유형 분류1.1 모델 성능 요약이 프로젝트에서 사용된 모델(CNN, LSTM 등)은 각각의 강점을 활용하여 고장 유형 분류에서 높은 성과를 보였습니다.모델정확도(Accuracy)정밀도(Precision)재현율(Recall)DNN88%86%85%CNN93%91%90%RNN (LSTM)91%90%92%결과 해석CNN 모델:가장 높은 정확도(93%)를 기록하며, 고장 유형을 효과적으로 분류.데이터의 국소적인 특징(진동 패턴)을..