1. 회의 정보
회의 목적:
•
공정 데이터 기반 프로젝트의 문제정의 및 핵심 메시지 정렬
•
전처리–분석 로드맵 확정
(전체 데이터 분석 + 제품 타입별 분석 병행, 변수/타입 분리, 상관관계 이슈 대응)
•
로지스틱 회귀 기반 위험도 점수(리스크 스코어) 산출 및 공정 점검·운영 활용 방향 논의
•
PPT 수정 흐름 정리 및 다음 공유 일정 확정
•
거버넌스 문서 필수 항목(성함/대주제/문제정의/역할분담) 기입 요청
회의 시간: 14:00 ~ 15:45 (튜터님 미팅 포함)
2. 회의 내용
운영·일정
•
(크리스마스)연말 일정 고려해 회의는 짧고 핵심 위주로 운영
•
이슈는 슬랙 선공유 → 필요 시 회의 재소집
프로젝트 현황
•
다이캐스팅 공정 데이터 기반으로
“불량/측정치 + 정상·비정상” 판단 모델 및 인사이트 도출 방향 논의
•
정식 기획/거버넌스 문서 미완 → 다음 미팅 전 최소 항목 필수 기입 필요
분석 전략
•
전처리는 현재 방식 유지 후 분석 진행
•
분석은 전체 1회 + 제품 타입별 1회 병행
•
전체 분석에서 과대 상관 가능 → 타입 분리 후 재확인
데이터 이슈
•
정상 비율 76.8%, 정상 교육 비율 76.3%
•
불량 분포: 단일 937건(88%), 복합 125건(12%)
•
분리·증강·중복 제거 방식이 상관·모델에 영향 → 기준 정리 필요
위험도 점수(로지스틱)
•
0~1 출력값은 확률이 아닌 공정 위험 가능성 점수로 해석
•
공정 점검 지표 및 알림(슬랙/이메일) 활용 가능성 논의
•
실무 관점의 산출·검증·운영 질문 리스트 필요
•
파악이 가능한지 확인
이상치·설비값·스케일링
•
이상치·설비값은 제거하지 않고 유지한 채 분석
•
스케일링은 효과 제한적 경험 공유 → 비용 큰 작업은 단계적 적용
발표/스토리라인
•
ML 비중 과도 지양(약 1/3 수준)
•
정의–근거–해석–개선 제안 중심 스토리 강화
•
경원님의 PPT 자료를 바탕으로 편집할 예정. 추가할 부분은 언제든지 수정!
3. 결정사항
•
전처리는 현재 방식 그대로 진행 (중간에 추가할 부분 있으면 슬랙에 남기기!)
•
분석은 전체 + 제품 타입별 병행
•
독립변수는 우선 유지, 결과 기반으로 중복·과상관 변수 제거
•
종속변수는 3개 카테고리 분류
•
이상치·설비값은 제거하지 않고 유지 (이상치가 생각보다 크게 유의미한 값을 가지지 않음.)
•
로지스틱 기반 위험도 점수 도입 검토 및 운영 알림 활용 추진
•
PPT는 1차 수정 후 가능성 확인되면 재공유
•
논의는 슬랙 선공유 원칙 유지
•
다음 회의: 내일 11:00
4. 역할 분담(업무 단위 기준)
PPT·스토리라인
•
PPT 수정 흐름 정리 및 1차 반영본 공유
•
해석·제안 파트 강화, ML 비중 조절
변수·타입 분리
•
타입1/2 정의 재검토
•
타입별 상관 구조 비교 및 기준 문서화
제품 타입별 분량·중복 제거
•
분량 집계 기준 확정
•
중복 정의(키/기간/설비/로트 등) 및 제거 로직 제안
위험도 점수·공정 점검
•
산출·검증·운영(임계값·알림·대응) 질문 리스트 정리
운영·협업
•
이슈 슬랙 선공유
•
회의 어젠다 취합 및 시간 제약 반영
5. 일정 및 후속 작업
오늘 ~ 다음 미팅 전
•
전처리·분석 파이프라인 우선 구동
•
타입 분리 기준·중복 제거 기준 초안 작성
•
위험도 점수 기반 공정 점검 질문서 초안 작성
•
튜터님께서 만드신 양식 정리(?)
다음 회의
•
내일 11:00: 진행 결과 공유 및 쟁점만 의사결정
6. 회의 운영 및 협업 방식
•
실행 우선, 결과 기반 논의
•
슬랙 선공유 → 회의는 결정 중심
•
전체 vs 타입별 병행 검증으로 상관관계 착시 방지
•
타입·변수·중복 기준은 문서로 고정
•
비용 큰 정제 작업은 효과 확인 후 단계적 수행
•
위험도 점수는 정답 예측이 아닌 조기 감지·운영 지표로 활용
•
시간 제약을 고려해 공유·발표는 핵심 위주
결론
•
팀은 공정 데이터 프로젝트에서 문제정의와 기준 문서화를 먼저 고정하고, 전처리–분석을 실행해 결과로 판단하는 방식에 합의했다.
•
분석은 전체와 제품 타입별을 병행해 상관관계 착시를 통제하고, 변수·중복·이상치는 유지 후 결과 기반으로 단계적 정제를 진행한다.
•
로지스틱 기반 위험도 점수는 공정 점검과 운영 알림까지 확장 가능한 지표로 검토하며, 다음 회의(내일 11:00)에서 실행 결과를 바탕으로 필요한 의사결정만 수행한다. (확인해봐야 함.)
