熊猫体育「中国」官方网站｜运动员大数据平台

Spark大数据分析案例之平均心率检测

行业动态 | 2026-01-27 19:00

　　平均心率检测案例。本案例以实验室之前发布的另一篇博客文章《Spark+Kafka构建实时分析Dashboard案例介绍》为基础，涉及模拟数据生成，数据预处理、消息队列发送和接收消息、数据实时处理、数据实时推送和实时展示等数据处理全流程，所涉及的各种典型操作涵盖Linux、Spark、Kafka、JAVA、MySQL、Ajax、Html、Css、Js、Maven等系统和软件的安装和使用方法。通过本案例，将有助于综合运用大数据课程知识以及各种工具软件，实现数据全流程操作。同时在此感谢张少坤、吴维奇和喻小丽等三位同学在创作本案例中的贡献。

　　请参照本教程Spark2.1.0入门：Spark的安装和使用，本套教程涵盖了三种软件的安装

　　spark-homework该链接为案例的代码，下载后输入以下命令。如果出现无法链接到该网页，可以在导航栏里输入s/1ciylS6域名。

Spark大数据分析案例之平均心率检测(图1)

　　1. common目录存放的是整个项目所公有的类。其中程序文件夹中包含beans, config, db和utils。Beans中存放实体类，config中存放相关配置的类，db中配置数据库的连接等，utils中存放产生Json的工具类等。

　　2. config目录存放的是整个项目的配置参数，比如kafka生产者的地址和端口号、数据库的配置，如账户名，密码等。Web浏览器访问的地址和端口号等。

　　4. streaming目录存放的是对kafka数据操作并写入数据库的相关文件；

　　5. web目录存放的含有对http响应的相关处理和资源文件。如js,css,html文件。

　　本案例采用的数据集是由应用程序producer随机产生的。该数据集表示的正常人的心跳速率。下面列出产生的数据格式定义：

　　这个案例实时检测平均心率，因此针对每条记录，我们只需要获取name和rate即可，然后发送给Kafka，接下来Spark Streaming再接收进行处理，将其写入MySQL数据库。Web通过间隔若干时间查询某个时间段内的心跳，并对其进行可视化。

　　上述代码很简单，首先通过随机产生RecordBean实体，然后通过Json工具进行序列化，接着每隔sleep秒发送给kafka。

　　通过streaming操作kafka获取数据后，将数据写入MySQL数据库。我们可以使用如下代码创建数据库和表。

　　开启spark streaming 服务并且它会从kafka主题中处理数据到MySQL。重新开启一个终端，前面的终端千万不要关闭。

　　开启kafka producer，并且它会将事件写入kafka主题中。重新开启一个终端，前面的终端千万不要关闭。

Spark大数据分析案例之平均心率检测(图2)

　　开启web服务器，如此可以观察dashboard。重新开启一个终端，前面的终端千万不要关闭。输入以下代码

Spark大数据分析案例之平均心率检测(图3)

　　最后在浏览器中输入进行浏览结果。三种颜色分别代表三个人，他们在不同时刻的平均心率。