목록머신러닝 (70)
Allen's 데이터 맛집
이번 프로젝트는 데이터 분석가로서 제 역량을 한 단계 성장시킨 값진 경험이었습니다.1. 데이터를 다룬다는 것의 의미처음 데이터를 접했을 때, 그 안에 숨겨진 패턴과 정보를 찾는다는 것이 얼마나 복잡한 일인지 다시금 깨달았습니다.결측값과 이상치를 정리하며 데이터를 정제하는 과정이 얼마나 중요한지 실감했고, 깨끗한 데이터를 기반으로 분석을 시작하는 것이 프로젝트의 절반 이상을 차지한다는 것을 배웠습니다."데이터는 모든 문제 해결의 시작이다"라는 말이 이번 프로젝트를 통해 더 깊이 와닿았습니다.2. 분석에서 중요한 것은 '소통'이다머신러닝 모델을 구축하고 성능을 높이는 과정 자체도 흥미로웠지만, 그 결과를 직관적으로 전달하는 일이 더 어렵다는 것을 느꼈습니다.데이터 분석가는 단순히 결과를 내는 사람을 넘어, ..
이 글에서는 회전기계 고장유형 AI 데이터 분석 프로젝트의 핵심인 데이터 전처리 과정과 AI 모델 설계에 대해 다뤄 보겠습니다. 데이터 전처리1. 데이터셋 구성Rotor Testbed에서 수집된 데이터는 각 센서에서 진동 값을 기록한 시계열 데이터로 구성됩니다.데이터는 다양한 고장 유형(질량 불균형, 지지 불량 등)을 포함하고 있으며, 각각의 데이터는 다음과 같은 속성을 가지고 있었습니다:Sampling Rate: 초당 10,000 샘플.측정 채널: 총 4개의 센서 채널.타겟 변수: 고장 유형(정상, 불균형, 지지 불량 등).2. 전처리 과정데이터 전처리는 모델 학습의 성공 여부를 좌우할 정도로 중요합니다.이번 프로젝트에서는 데이터를 분석에 적합하게 정제하기 위해 아래 단계를 거쳤습니다.2.1 결측값 처..
이 프로젝트를 마치며, 단순히 데이터를 분석하고 결과를 도출하는 것을 넘어, 문제를 정의하고 해결해가는 과정에서 많은 것을 배웠습니다.스마트 팩토리라는 실무 환경에서 데이터 분석이 실제로 어떤 가치를 가져다주는지 체감할 수 있었던 소중한 경험이었습니다. 1. 프로젝트 결과 요약 품질 이상 탐지 모델의 성과프로젝트에서 사용한 두 가지 머신러닝 모델, Isolation Forest와 AutoEncoder, 모두 훌륭한 결과를 보여주었습니다.모델 성능을 정확도와 정밀도로 평가했을 때, 각각의 모델이 목표로 삼았던 영역에서 적합한 성과를 보였습니다.모델정확도(Accuracy)정밀도(Precision)재현율(Recall)Isolation Forest92%88%85%AutoEncoder95%91%89%결론:Isol..
스마트 팩토리에서 가장 흥미로운 순간은 데이터를 기반으로 실제 문제를 해결하는 단계입니다.이번 글에서는 제가 품질 이상 탐지 및 진단을 위해 어떻게 머신러닝 모델을 활용했는지 소개하려고 합니다.이상 탐지의 핵심: "정상"을 정의머신러닝 모델을 설계하며 가장 먼저 고민했던 것은 "정상 데이터란 무엇인가?" 였습니다.품질 이상을 감지하려면 먼저 정상적인 공정 상태의 패턴을 이해해야 하기 때문입니다.예를 들어, 온도와 pH, 압력 등의 값이 어떤 범위 내에 있을 때 정상으로 간주할 수 있는지를 명확히 정의해야 했습니다.제가 사용한 크로메이트 데이터는 정상 상태와 이상 상태가 명확히 레이블링되어 있어 다행히도 이 작업을 쉽게 시작할 수 있었습니다.하지만 실제 데이터를 분석하다 보니, "정상"과 "이상"의 경계가..