목록Machine Learning (48)
Allen's 데이터 맛집
모델을 처음 만들어보면, 대부분 Accuracy(정확도)에 집착합니다.“와, 정확도 95%야!” — 숫자는 멋있죠.하지만 실제로는 이 95%가 아무 의미 없을 수도 있습니다.Accuracy는 유용하지만, 진실을 가려버리는 지표가 될 때가 많아요.특히 불균형 데이터(imbalanced data)에서는 더더욱 그렇습니다.1️⃣ Accuracy의 함정Accuracy는 “전체 중 정답을 맞힌 비율”이죠.예를 들어, 암 진단 데이터에서환자 1,000명 중 실제 암 환자는 10명뿐이고모델이 모두 ‘암 아님’이라고 예측했다면?정확도는 무려 99%입니다.하지만 정작 진짜 암 환자 10명을 전부 놓쳤죠.이런 모델을 믿을 수 있을까요?Accuracy는 전체 비율만 보기 때문에,소수 클래스(중요하지만 드문 경우)를 완전히 ..
TensorFlow는 Google Brain 팀이 개발한 오픈 소스 머신러닝 프레임워크로, 딥러닝과 머신러닝 모델의 구축, 훈련, 배포를 통합적으로 지원합니다. 그 직관성과 확장성 덕분에 초보자부터 전문가까지 널리 사랑받고 있으며, 연구, 산업, 교육 등 다양한 분야에서 필수적인 도구로 자리 잡았습니다. TensorFlow란 무엇인가?1. TensorFlow의 정의TensorFlow는 데이터 흐름 그래프를 기반으로 수학적 연산을 처리하며, 텐서(Tensor)라는 다차원 배열 구조를 사용해 데이터 연산을 수행합니다.Tensor: 데이터를 나타내는 다차원 배열.Flow: 데이터의 이동과 연산 과정을 그래프 형태로 시각화.2. TensorFlow의 핵심 목표범용성: 다양한 환경(모바일, 서버, 클라우드)에서 ..
빅데이터를 머신러닝 모델로 학습할 때 발생하는 시간 문제를 해결하기 위해 학습된 모델을 저장하고 다시 로드하는 방법에 대해 공유해보려고 합니다. 이 방법을 사용하면 모델을 매번 새로 학습하지 않고, 저장된 모델을 불러와 사용할 수 있어 매우 효율적입니다. 1. 프로젝트 개요빅데이터를 머신러닝 모델로 학습할 때, 일반 컴퓨터로는 매우 오랜 시간이 걸릴 수 있습니다. 매번 모델을 새로 학습하는 것은 비효율적이므로, 학습된 모델을 저장하고 이를 다시 로드하여 사용하는 방법을 알아보겠습니다.2. 모델 저장하기모델 학습 후, 학습된 모델을 파일로 저장할 수 있습니다. 여기서는 sklearn과 tensorflow를 사용하여 모델을 저장하는 방법을 소개합니다. 2.1. sklearn 모델 저장하기sklearn 모델..
머신러닝과 기계학습에서 모델의 성능을 평가하고 최적화하는 데 중요한 역할을 하는 손실 함수(loss function)에 대해 알아보겠습니다. 손실 함수는 모델의 예측값과 실제값 간의 차이를 측정하여, 이 차이를 최소화하는 방향으로 모델을 학습시킵니다. 이미지 출처 :https://velog.io/@kellypark1615/AIS7-%EC%86%90%EC%8B%A4%ED%95%A8%EC%88%98-Loss-Function%EC%9D%98-%EA%B0%9C%EB%85%90 손실 함수란 무엇인가요?손실 함수는 예측값과 실제값 사이의 차이를 측정하는 함수입니다. 손실 함수의 출력 값은 모델의 예측이 얼마나 잘못되었는지를 나타내며, 이 값을 최소화하는 것이 모델 학습의 목표입니다. 주요 손실 함수 소개1...
