0

0

FTP上传XML文件 Java/Python脚本如何实现

煙雲

煙雲

发布时间:2026-01-21 10:31:02

|

206人浏览过

|

来源于php中文网

原创

最稳妥方案是Java用Apache Commons Net的FTPClient以二进制模式上传XML。需设FTP.BINARY_FILE_TYPE、UTF-8编码、被动模式,并校验文件大小或哈希,避免换行符损坏和乱码。

ftp上传xml文件 java/python脚本如何实现

Java用Apache Commons Net实现FTP上传XML文件

Java里最稳妥的方案是用 org.apache.commons.net.ftp.FTPClient,它对二进制传输、编码、被动模式支持完整,避免XML文件因换行符或UTF-8 BOM被截断或乱码。

关键点在于:XML必须以 FTP.BINARY_FILE_TYPE 上传,否则ASCII模式会把 \r\n 转成 \n,破坏XML结构;同时要显式设置客户端编码为 UTF-8,否则文件名含中文时可能失败。

  • 调用 ftpClient.setFileType(FTP.BINARY_FILE_TYPE),别依赖默认值
  • 连接后立即执行 ftpClient.setControlEncoding("UTF-8")
  • 启用被动模式:ftpClient.enterLocalPassiveMode(),否则内网/容器环境大概率超时
  • 上传前检查目标路径是否存在,ftpClient.changeWorkingDirectory("/upload") 失败时不抛异常,需手动判断返回值
FTPClient ftp = new FTPClient();
ftp.connect("ftp.example.com", 21);
ftp.login("user", "pass");
ftp.setControlEncoding("UTF-8");
ftp.setFileType(FTP.BINARY_FILE_TYPE);
ftp.enterLocalPassiveMode();
if (!ftp.changeWorkingDirectory("/xml")) {
    throw new IOException("Target dir /xml not found");
}
try (InputStream is = Files.newInputStream(Paths.get("data.xml"))) {
    ftp.storeFile("report_2024.xml", is);
}

Python用ftplib上传XML注意换行与编码

ftplib.FTP 默认用 ASCII 模式传文件,直接 storbinary() 传XML没问题,但若用 storlines() 就会出事——它按行读取并替换换行符,导致XML声明 <?xml version="1.0" encoding="UTF-8"?> 后面的 \n 被改写,解析器报错 ParseError: mismatched tag

  • 一律用 storbinary(),哪怕文件是纯文本
  • 打开本地XML文件必须用 rb 模式,不能用 r,否则Windows下 \r\n 可能被Python自动转换
  • 如果XML含中文且服务器文件系统是GBK(如老版Windows Server),上传后需在服务端用 iconv 转码,Python侧无法干预
  • 建议上传前先 ftp.pwd() 确认当前路径,避免因路径错误静默失败
from ftplib import FTP
ftp = FTP()
ftp.connect("ftp.example.com", 21)
ftp.login("user", "pass")
ftp.cwd("/xml")
with open("config.xml", "rb") as f:
    ftp.storbinary("STOR config_v2.xml", f)
ftp.quit()

上传后校验XML是否完整可用

FTP协议不保证传输完整性,网络抖动或服务器磁盘满时,可能只写入部分字节,而 storeFile()storbinary() 仍返回成功。XML文件一旦缺失结束标签或属性引号,下游系统解析直接崩溃。

云从科技AI开放平台
云从科技AI开放平台

云从AI开放平台

下载

立即学习Java免费学习笔记(深入)”;

  • 上传后立刻用 ftp.size("file.xml") 对比本地 os.path.getsize(),大小不等说明传输中断
  • 更可靠的做法:上传后用 ftp.retrbinary() 下载回来,做SHA256哈希比对(适合小文件)
  • 不要依赖FTP服务器日志——很多共享主机不记录具体文件操作,且日志延迟高
  • 如果下游是Java系统,可加一步远程执行 xmllint --noout file.xml(需服务器装libxml2),但需额外SSH权限

为什么不用SFTP替代FTP?

因为很多政务、银行老系统只开放FTP端口(21),禁用SSH(22),且明确要求XML必须用明文FTP上传。强行上SFTP会卡在合规审批环节。但要注意:FTP密码和XML内容都在明文传输,如果中间有Wireshark抓包,敏感字段(如身份证、金额)会裸奔。

  • XML中敏感字段必须提前AES加密,再base64编码,不能靠FTP“安全”
  • 测试环境可用 vsftpd 搭本地FTP,配置 pasv_min_port=50000pasv_max_port=50010,避免端口随机导致防火墙放行困难
  • Java用 FTPClient 时,若遇到 java.net.SocketTimeoutException: Read timed out,大概率是被动模式端口没通,不是代码问题

FTP上传XML真正难的不是写几行代码,而是确认对方FTP服务器的字符集、目录权限、被动端口范围、以及是否悄悄启用了FTP over TLS(即FTPS)。这些信息不问清楚,光调通本地脚本没用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1948

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2119

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1171

2024.11.28

常见的编码方式
常见的编码方式

常见的编码方式有ASCII编码、Unicode编码、UTF-8编码、UTF-16编码、GBK编码等。想了解更多编码方式相关内容,可以阅读本专题下面的文章。

647

2023.10.24

a和A对应的ASCII码数值
a和A对应的ASCII码数值

a的ascii码是65,a的ascii码是97;ascii码表中,一个字母的大小写数值相差32,一般知道大写字母的ascii码数值,其对应的小写字母的ascii码数值就算出来了,是大写字母的ascii码数值“+32”。想了解更多相关的内容,可阅读本专题下面的相关文章。

2257

2024.10.24

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1496

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1170

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

836

2023.08.01

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

1

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号