한 게임 회사가 무료로 게임을 시작할 수 있지만 특정 기능을 사용하려면 비용을 지불해야 하는 온라인 게임을 출시했습니다. 이 회사는 신규 사용자가 1년 이내에 유료 사용자가 될지 여부를 예측하는 자동화된 시스템을 구축해야 합니다. 이 회사는 100만 명의 사용자로부터 라벨이 지정된 데이터셋을 수집했습니다. 학습 데이터셋은 각각 1.000개의 양성 샘플(1년 이내에 유료로 전환한 사용자)과 999.1개의 음성 샘플(유료 기능을 전혀 사용하지 않은 사용자)로 구성됩니다
A. 모델이 더 많은 기능을 학습할 수 있도록 무작위 숲에 더 깊은 나무를 추가합니다
B. 훈련 데이터 세트에 테스트 데이터베이스의 샘플 사본을 표시합니다
C. 양성 샘플을 복제하고 복제된 데이터에 소량의 노이즈를 추가하여 더 많은 양성 샘플을 생성합니다
D. 오탐이 오탐보다 비용 값에 더 큰 영향을 미치도록 비용 함수를 변경합니다
E. 오탐이 오탐보다 비용 값에 더 큰 영향을 미치도록 비용 함수를 변경합니다