Uma empresa de jogos lançou um jogo em linha em que as pessoas podem começar a jogar gratuitamente, mas têm de pagar se optarem por utilizar determinadas funcionalidades. A empresa precisa de criar um sistema automatizado para prever se um novo utilizador se tornará ou não um utilizador pago no prazo de 1 ano. A empresa reuniu um conjunto de dados rotulados de 1 milhão de utilizadores. O conjunto de dados de treino consiste em 1 000 amostras positivas (de utilizadores que acabaram por pagar no prazo de 1 ano) e 999 1 amostras negativas (de utilizadores que não utilizaram quaisquer funcionalidades pagas)
A. Adicione mais árvores profundas à floresta aleatória para permitir que o modelo aprenda mais características
B. indicar uma cópia das amostras da base de dados de teste no conjunto de dados de treino
C. Gerar mais amostras positivas duplicando as amostras positivas e adicionando uma pequena quantidade de ruído aos dados duplicados
D. Alterar a função de custo de modo a que os falsos negativos tenham um impacto maior no valor do custo do que os falsos positivos
E. Alterar a função de custo de modo a que os falsos positivos tenham um impacto maior no valor do custo do que os falsos negativos