1. 회의 정보
•
회의 목적: 비즈니스 문제 설정 및 계획, 일정 계획 수립하기
◦
다이캐스팅 공정 및 센서 데이터를 활용한 비즈니스 문제 명확화
◦
불량률 예측 문제 정의 정교화
◦
모델링 논리 구조 강화 방향 논의 및 전체 일정 수립
•
회의 시간: 14:00 ~ 15:40
2. 회의 내용
2-1. 비즈니스 배경 및 문제 인식
•
다이캐스팅 공정에서 미성형, 기공, 박리 등 불량이 지속 발생
•
불량 판정이 육안 검사 중심이며, 공정 종료 후 사후 대응 구조
•
공정 조건과 불량 발생 간의 인과관계를 정량적으로 추적하기 어려움
•
공정 개선이 경험과 시행착오에 의존 → 불량률 증가, 스크랩·재작업 비용 상승
2-2. 데이터 분석 현황
•
전체 데이터 구조를 재검토하며 문제 정의 중심으로 방향 재정렬
•
부가 변수와 맥락 정보가 많아 핵심 질문 중심의 분석 플로우 단순화 필요
•
프로젝트 발제 시 문제 정의를 1단계–2단계–3단계 구조로 정리하기로 제안
2-3. 데이터로 답하고자 하는 핵심 질문
핵심 질문
•
공정·센서 데이터로 불량을 사전에 예측할 수 있는가
•
불량에 가장 큰 영향을 주는 공정 조건은 무엇인가
세부 질문
•
공정 변수의 안정적 작동 범위는 어디까지인가
•
불량 유형별 주요 원인 변수는 어떻게 달라지는가
•
shot 수 증가에 따라 불량률이 증가하는 패턴이 존재하는가
3. 결정 사항
3-1. 문제 정의 및 분석 목표
•
불량을 맞히는 모델이 아닌,
불량을 사전에 예측하고 원인을 설명하며 공정을 개선하는 모델을 목표로 설정
•
지도학습 기반 분류 문제로 정의
◦
종속변수: 불량 여부 / 불량 유형
◦
독립변수: 공정 및 센서 변수
3-2. 모델링 전략
•
로지스틱 회귀를 핵심 베이스라인 모델로 채택
◦
가중치 해석을 통한 변수 영향력 정량화
•
지도학습 + 비지도학습 병행
◦
지도학습: 예측 및 인과 해석 중심
◦
비지도학습(PCA 등): 변수 구조 이해 및 논리 보조 설명
•
확장 방향
◦
로지스틱 회귀 단독
◦
로지스틱 회귀 vs 트리 기반 모델 비교
◦
SHAP value를 활용한 해석력 강화
3-3. 평가 지표
•
Precision, Recall, F1-score, ROC-AUC
•
통계적 해석 목적의 R-square, p-value 병행 활용
4. 팀 역할 분담
•
김혜경: 데이터 전처리
•
김경원: 다항 로지스틱 회귀 검토
•
김시우: 데이터 전처리 및 모델 후보 탐색
•
김채윤: 데이터 전처리 및 스케일링 전략 학습
•
이승주: 외부 비즈니스·공정 레퍼런스 자료 탐색 및 전처리 지원
5. 일정 및 후속 작업
•
19일(금): 데이터 전처리 및 파생 변수 공유
•
22일(월): EDA 1차 완료, 통계 분석 계획 수립
•
23일(화): EDA 인사이트 종합 정리, 모델링 방향 최종 확정
◦
EDA 반드시 종료
•
24~25일: 머신러닝 개인별 진행
•
26일(금): 전체 결론 도출, 발표 자료 준비 시작
•
28일(일): 머신러닝 마무리
•
29일(월): 발표 자료 최종 점검
(작업하다가 미뤄질 수도 있음.)
6. 회의 운영 및 협업 방식
•
공정 변수는 물리적 의미 기반 해석을 원칙으로 접근
•
모델 성능보다 논리적 설명력과 비즈니스 연결성을 우선
•
변수 스케일링, 변수 묶음, LASSO 기반 변수 선택 등은 공동 논의 후 결정
•
결과 공유 시
◦
“무엇을 맞췄는가”보다
◦
“왜 이런 결과가 나왔는가”를 중심으로 설명
결론
이번 프로젝트의 핵심 방향은 다음 한 문장으로 정리된다.
불량을 맞히는 모델이 아니라,
불량을 사전에 예측하고,
왜 발생하는지를 설명하며,
공정을 개선할 수 있는 모델을 구축한다.
이를 위해
•
로지스틱 회귀 기반의 해석 가능한 모델을 중심에 두고
•
데이터 한계를 인지한 상태에서 파생 변수, 통계적 검증, 보조적 비지도 학습을 활용하여
•
현업 의사결정에 바로 연결 가능한 인사이트 도출을 목표로 한다.
