/////
Search

[251219] 오후 회의록

태그
정기회의
날짜
2025/12/19
참석자
해야할 일

1. 회의 정보

회의 목적: 비즈니스 문제 설정 및 계획, 일정 계획 수립하기
다이캐스팅 공정 및 센서 데이터를 활용한 비즈니스 문제 명확화
불량률 예측 문제 정의 정교화
모델링 논리 구조 강화 방향 논의 및 전체 일정 수립
회의 시간: 14:00 ~ 15:40

2. 회의 내용

2-1. 비즈니스 배경 및 문제 인식

다이캐스팅 공정에서 미성형, 기공, 박리 등 불량이 지속 발생
불량 판정이 육안 검사 중심이며, 공정 종료 후 사후 대응 구조
공정 조건과 불량 발생 간의 인과관계를 정량적으로 추적하기 어려움
공정 개선이 경험과 시행착오에 의존 → 불량률 증가, 스크랩·재작업 비용 상승

2-2. 데이터 분석 현황

전체 데이터 구조를 재검토하며 문제 정의 중심으로 방향 재정렬
부가 변수와 맥락 정보가 많아 핵심 질문 중심의 분석 플로우 단순화 필요
프로젝트 발제 시 문제 정의를 1단계–2단계–3단계 구조로 정리하기로 제안

2-3. 데이터로 답하고자 하는 핵심 질문

핵심 질문
공정·센서 데이터로 불량을 사전에 예측할 수 있는가
불량에 가장 큰 영향을 주는 공정 조건은 무엇인가
세부 질문
공정 변수의 안정적 작동 범위는 어디까지인가
불량 유형별 주요 원인 변수는 어떻게 달라지는가
shot 수 증가에 따라 불량률이 증가하는 패턴이 존재하는가

3. 결정 사항

3-1. 문제 정의 및 분석 목표

불량을 맞히는 모델이 아닌,
불량을 사전에 예측하고 원인을 설명하며 공정을 개선하는 모델을 목표로 설정
지도학습 기반 분류 문제로 정의
종속변수: 불량 여부 / 불량 유형
독립변수: 공정 및 센서 변수

3-2. 모델링 전략

로지스틱 회귀를 핵심 베이스라인 모델로 채택
가중치 해석을 통한 변수 영향력 정량화
지도학습 + 비지도학습 병행
지도학습: 예측 및 인과 해석 중심
비지도학습(PCA 등): 변수 구조 이해 및 논리 보조 설명
확장 방향
로지스틱 회귀 단독
로지스틱 회귀 vs 트리 기반 모델 비교
SHAP value를 활용한 해석력 강화

3-3. 평가 지표

Precision, Recall, F1-score, ROC-AUC
통계적 해석 목적의 R-square, p-value 병행 활용

4. 팀 역할 분담

김혜경: 데이터 전처리
김경원: 다항 로지스틱 회귀 검토
김시우: 데이터 전처리 및 모델 후보 탐색
김채윤: 데이터 전처리 및 스케일링 전략 학습
이승주: 외부 비즈니스·공정 레퍼런스 자료 탐색 및 전처리 지원

5. 일정 및 후속 작업

19일(금): 데이터 전처리 및 파생 변수 공유
22일(월): EDA 1차 완료, 통계 분석 계획 수립
23일(화): EDA 인사이트 종합 정리, 모델링 방향 최종 확정
EDA 반드시 종료
24~25일: 머신러닝 개인별 진행
26일(금): 전체 결론 도출, 발표 자료 준비 시작
28일(일): 머신러닝 마무리
29일(월): 발표 자료 최종 점검
(작업하다가 미뤄질 수도 있음.)

6. 회의 운영 및 협업 방식

공정 변수는 물리적 의미 기반 해석을 원칙으로 접근
모델 성능보다 논리적 설명력과 비즈니스 연결성을 우선
변수 스케일링, 변수 묶음, LASSO 기반 변수 선택 등은 공동 논의 후 결정
결과 공유 시
“무엇을 맞췄는가”보다
“왜 이런 결과가 나왔는가”를 중심으로 설명

결론

이번 프로젝트의 핵심 방향은 다음 한 문장으로 정리된다.
불량을 맞히는 모델이 아니라, 불량을 사전에 예측하고, 왜 발생하는지를 설명하며, 공정을 개선할 수 있는 모델을 구축한다.
이를 위해
로지스틱 회귀 기반의 해석 가능한 모델을 중심에 두고
데이터 한계를 인지한 상태에서 파생 변수, 통계적 검증, 보조적 비지도 학습을 활용하여
현업 의사결정에 바로 연결 가능한 인사이트 도출을 목표로 한다.