0

0

Keras二分类模型预测单一类别问题分析与解决策略

聖光之護

聖光之護

发布时间:2025-11-21 13:30:39

|

680人浏览过

|

来源于php中文网

原创

Keras二分类模型预测单一类别问题分析与解决策略

本文旨在解决keras二分类模型在平衡数据集上始终预测单一类别的问题。文章深入分析了数据中可能缺乏底层相关性、特征复杂性以及模型选择不当等潜在原因。我们提供了一套全面的解决策略,包括强化探索性数据分析(eda)、优先尝试传统统计模型以验证特征有效性、精细化特征工程,以及在数据理解基础上优化深度学习模型的实用建议,旨在帮助开发者构建更鲁棒、准确的分类器。

当Keras构建的二分类模型在训练后始终预测单一类别时,这是一个常见的、令人困扰的问题,即使数据集本身是平衡的。这种现象表明模型未能从数据中学习到有效的区分模式,而是采取了最保守的策略——总是输出训练集中损失最小的那个类别。

问题复现与初步分析

开发者遇到的问题是,一个用于预测“销售额”(sales)的Keras神经网络模型,在经过训练后,其混淆矩阵显示所有预测都集中在“Negative”(或类别0)上,即True Positives (TP) 和 False Positives (FP) 均为零。这意味着模型完全无法识别正类别。

开发者采取了以下典型步骤:

Flowith
Flowith

一款GPT4驱动的节点式 AI 创作工具

下载
  1. 数据准备:

    • 将sales列二值化(False或True),并使用LabelEncoder对类别和布尔类型特征进行编码
    • accessed_date时间戳转换为浮点数。
    • 分离特征(X)和目标(Y),并对X进行Normalizer标准化处理。
      import numpy as np
      import pandas as pd
      from sklearn.preprocessing import LabelEncoder, Normalizer
      from sklearn.model_selection import train_test_split
      import tensorflow as tf
      from tensorflow.keras.models import Sequential
      from tensorflow.keras.layers import Dense, Dropout
      from tensorflow.keras.initializers import he_normal

    假设 purchase_data 已加载

    data = purchase_data.copy() labelencoder = LabelEncoder() target_sum = 120 data.loc[data['sales'] target_sum, 'sales'] = True

    编码类别和布尔特征

    for col in data.columns.values.tolist(): if data[col].dtype == "object" or data[col].dtype == "bool": data[col] = labelencoder.fit_transform(data[col])

    转换日期时间

    data['accessed_date'] = data['accessed_date'].apply(lambda x: x.timestamp())

    分离特征和目标

    array = data.values class_column = 'sales' X = np.delete(array, data.columns.get_loc(class_column), axis=1) Y = array[:,data.columns.get_loc(class_column)] Y = Y[:, np.newaxis] # 调整Y的形状以适应Keras

    标准化输入特征

    scaler = Normalizer().fit(X) X = scaler.transform(X)

  2. 数据集划分:

    • 使用train_test_split将数据划分为训练集和测试集,并设置stratify=Y以确保训练集和测试集中的类别分布与原始数据保持一致。
      seed = 1
      X_train, X_test, Y_train, Y_

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

214

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

192

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

60

2026.01.05

数据库Delete用法
数据库Delete用法

数据库Delete用法:1、删除单条记录;2、删除多条记录;3、删除所有记录;4、删除特定条件的记录。更多关于数据库Delete的内容,大家可以访问下面的文章。

287

2023.11.13

drop和delete的区别
drop和delete的区别

drop和delete的区别:1、功能与用途;2、操作对象;3、可逆性;4、空间释放;5、执行速度与效率;6、与其他命令的交互;7、影响的持久性;8、语法和执行;9、触发器与约束;10、事务处理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.12.29

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

7

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

32

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Rust 教程
Rust 教程

共28课时 | 6.5万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号