0

0

新浪财经知识图谱解译平台

P粉084495128

P粉084495128

发布时间:2025-07-24 10:04:34

|

701人浏览过

|

来源于php中文网

原创

本项目围绕新浪财经股票信息构建知识图谱并解译。通过爬取新浪财经股票数据存为Excel,用Python处理生成三元组文件,导入GraphDB构建知识库。前端接收用户输入,经后台服务器转发至语义解析服务转为SPARQL,查询知识图谱后返回结果显示,实现股票信息的智能查询。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

新浪财经知识图谱解译平台 - php中文网

新浪财经知识图谱解译平台

经济就是人们生产、流通、分配、消费一切物质精神资料的总称。经济的发展与人民生活息息相关。

新浪财经是国内第一大财经网络媒体。新浪财经打造高端新闻资讯,深度挖掘业内信息,全程报道80%以上的业界重要会议及事件,独家率达90%,是最具影响力的主流媒体平台。同时,新浪财经也开发出如金融超市、股市行情、基金筛选器、呼叫中心,金融产品在线查询等一系列实用产品,帮助网民理财,是最为贴心实用的服务平台。除此之外,新浪财经为网友搭建互动、交流、学习的财经大平台。财经博客、财经吧、模拟股市、模拟汇市等均成为业界最早、人气最旺、最知名的财经互动社区。

基于领先的财经资讯和贴心的产品服务,新浪财经吸引了非常庞大的高端用户群,已经成为金融行业客户进行网络营销的主要平台,同时也获得了非金融类客户的广泛青睐。

新浪财经知识图谱解译平台 - php中文网        

本项目爬取新浪财经中的股票信息,制作成知识图谱,并尝试对知识图谱进行解译。

项目设计

项目设计如图,web前端接收用户输入,将用户输入发送到后台的用户服务器,并由用户服务器转发到语义解析服务,语义解析根据用户输入信息转化为sparql语言,发送给用户服务器,用户服务器再将sparql发送到知识图谱库中查找结果返回给用户服务器,最终用户服务器将结果显示到前端。

新浪财经知识图谱解译平台 - php中文网        

数据获取以及构建知识图谱

  • 使用软件对新浪财经网站进行爬取,爬取后的数据保存为Excel文件。

新浪财经知识图谱解译平台 - php中文网        

  • 使用python读取Excel并按照数据格式自定义三元组,将三元组保存为.shtml.nt文件,代码如下。

新浪财经知识图谱解译平台 - php中文网        

  • 在GraphDB上新开一个知识库,将.shtml.nt文件导入到知识库中

新浪财经知识图谱解译平台 - php中文网        

In [ ]
import pandas as pdimport numpy as np

df = pd.read_excel('新浪行业_板块行情_新浪财经_新浪网.xlsx')with open('SinaFinance.shtml.nt','w',encoding='utf-8') as fp:
    fp.write('  "Sina Finance".\n')
    fp.write('  "新浪财经".\n')
    fp.write('  "http://finance.sina.com.cn/".\n')
    classes = np.array(df['板块']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  .\n')
   
In [ ]
import pandas as pdimport numpy as np

df = pd.read_excel('新浪行业_板块行情_新浪财经_新浪网.xlsx')
df2 = pd.read_excel('行情中心_新浪财经_新浪网.xlsx')with open('SinaClass.shtml.nt','w',encoding='utf-8') as fp:
    classes = np.array(df['板块']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  "'+v+'".\n')
    classes = np.array(df['链接地址']).astype(np.str)    for i,v in enumerate(classes):
        fp.write('  "'+v+'".\n')    id = np.array(df2['页面网址']).astype(np.str)
    id2 = np.array(df['链接地址']).astype(np.str)    for i,v in enumerate(id):        for j,k in enumerate(id2):            if v.split('#')[-1]==str(k).split('#')[-1] and not pd.isnull(df2.loc[i,'代码']):
                fp.write('  .\n')with open('Stock.shtml.nt','w',encoding='utf-8') as fp:    id = np.array(df2['代码']).astype(np.str)    for i,v in enumerate(id):
        fp.write('  "'+str(v)+'".\n')
        fp.write('  "'+str(df2.loc[i,'名称'])+'".\n')
        fp.write('  "'+str(df2.loc[i,'代码_链接'])+'".\n')
   

知识图谱结构展示

新浪财经知识图谱解译平台 - php中文网        

新浪财经知识图谱解译平台 - php中文网        

新浪财经知识图谱解译平台 - php中文网        

web前后端设计

前端

前端使用vue框架进行设计,代码详见SinaFinanceKnowledge\zg-vue

NeoAgent
NeoAgent

销售易推出的AI‑CRM智能体平台

下载

新浪财经知识图谱解译平台 - php中文网        

用户服务器

后台使用springboot撰写与知识图谱的对接接口,代码详见SinaFinanceKnowledge\zg-java

新浪财经知识图谱解译平台 - php中文网        

语义解析服务器

由于语义解析部分使用python+paddlepaddle构建,所以语义解析服务器使用django搭建的,代码详见SinaFinanceKnowledge\text2sparql

新浪财经知识图谱解译平台 - php中文网        

语义解析

代码及模型

详见text2sparql.ipynb

部署

由于深度学习使用的python语言,所以本地部署使用django第三方库来生成后台服务接口。部署代码和预测代码差不多。 这里注意的是,由于我们生成的词典全部使用小写,所以生成后的部分语句中的特定词需要转为sparql中的定义词。如:

sparql = " ".join(word_list_s).replace('sct:haschineselabel','sct:hasChineseLabel').replace('sct:id','sct:ID').replace('zg:sinafinance','zg:SinaFinance')
   

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

778

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

685

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

769

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

739

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1445

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

571

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

580

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

751

2023.08.11

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

1

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Vue 教程
Vue 教程

共42课时 | 7.2万人学习

Vue3.x 工具篇--十天技能课堂
Vue3.x 工具篇--十天技能课堂

共26课时 | 1.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号