机器学习_XGBoost模型_用C++推理示例Demo

惊鸿一博

发布时间 2024.06.24阅读数 113 评论数 0

1. 需求

将 python 训练好的 xgboost 模型, 使用C++ 进行加载并进行推理(预测)

2. 代码实现

#include <iostream>
#include <fstream>
#include <sstream>
#include <vector>
#include <string>
#include <xgboost/c_api.h>
 
const char *model_path = "my_xgb.model";
 
// 预测单条数据
void test_xgboost_one_item(std::vector<float> features)
{
    // load confidence prediction model
    BoosterHandle booster;
    XGBoosterCreate(NULL, 0, &booster);
    XGBoosterLoadModel(booster, model_path);
 
    DMatrixHandle dtest;
    XGDMatrixCreateFromMat(reinterpret_cast<float*>(&features[0]), 1, features.size(), 0, &dtest);
 
    // 进行预测
    const float *out_result;
    unsigned long out_len;
    XGBoosterPredict(booster, dtest, 0, 0, 0, &out_len, &out_result);
 
    // 输出预测结果
    std::cout << "Prediction result: ";
    for (unsigned long i = 0; i < out_len; ++i) {
        std::cout << out_result[i] << " ";
    }
    std::cout << std::endl;
 
    // 释放资源
    XGDMatrixFree(dtest);
    XGBoosterFree(booster);
 
}
 
// 预测多条数据(来自文件.txt)
void test_xgboost_from_file(std::string file_name)
{
    BoosterHandle booster;
    XGBoosterCreate(NULL, 0, &booster);
    XGBoosterLoadModel(booster, model_path);
 
    // 打开文件
    std::ifstream datasets_file(file_name);
    if (!datasets_file.is_open()) {
        std::cerr << "Failed to open the file: " << file_name << std::endl;
    }
 
    // 读取文件内容并存储到二维vector数组中
    std::vector<std::vector<float>> test_data_src;
 
    std::string line;
 
    while (std::getline(datasets_file, line))
    {
        std::istringstream iss(line);
        std::vector<float> row_src;
        std::string token;
        
        //仅读取一行中的前7个数据,举例.
        for (int i = 0; i < 7; ++i)
        {
            // 读取每行的前7个元素
            std::getline(iss, token, ',');
            float value = std::stof(token);
            row_src.push_back(value);
        }
        test_data_src.push_back(row_src);
    }
 
    // 关闭文件
    datasets_file.close();
    
    std::cout << "====== test_data_src ========" << std::endl;
    // 输出二维vector数组中的数据（可选）
    for (const auto& row : test_data_src) {
        for (const auto& value : row) {
            std::cout << value << " ";
        }
        std::cout << std::endl;
    }
 
    //注意: test data 需要 和训练模型时的数据保持一致, 即经过相同的预处理(若有)
    
    //注意: 重要操作, 为了通过第一个数据地址,访问到所有数据.
    // 将二维vector数组转换为一维的连续内存块
    std::vector<float> flatData;
    for (const auto& row : test_data_src) {
        flatData.insert(flatData.end(), row.begin(), row.end());
    }
 
    // 将测试数据转换为DMatrix格式
    DMatrixHandle dtest;
    bst_ulong nrow = test_data_src.size();
    bst_ulong ncol = test_data_src[0].size();
    XGDMatrixCreateFromMat(flatData.data(), nrow, ncol, 0, &dtest);
 
    // 进行预测
    const float *out_result;
    unsigned long out_len;
    XGBoosterPredict(booster, dtest, 0, 0, 0, &out_len, &out_result);
 
    // 输出预测结果
    std::cout << "Prediction result: " << std::endl;;
    for (unsigned long i = 0; i < out_len; ++i) {
        std::cout << out_result[i] << " "<< std::endl;
    }
    std::cout << std::endl;
 
    // 保存预测结果到文件(可选)
    std::ofstream file_prediction("predict_result.txt", std::ofstream::trunc);
    if (!file_prediction.is_open()) {
        std::cerr << "Failed to open the file." << std::endl;
    }
 
    for (unsigned long i = 0; i < out_len; ++i) {
        file_prediction << out_result[i] << " "<< std::endl;
    }
    // 关闭文件
    file_prediction.close();
 
    // 释放资源
    XGDMatrixFree(dtest);
    XGBoosterFree(booster);
 
}
int main(int argc, char **argv) {
    
    // 测试1: 仅预测一条数据 (使用7个feture,预测输出一个output数据)
    std::vector<float> features = {0.562000, 0.739818, 0.917457, 0.943217, 0.055662, 0.994000, 0.995506};
    test_xgboost_one_item(features);
 
    // 测试2: 预测存储在文件中的多条数据 (使用7个feture,预测输出一个output数据)
    std::string test_data_normalsets = "test_data.txt";
    // test_data.txt 内容:
        // 0.562000 0.739818 0.917457 0.943217 0.055662 0.994000 0.995506
        // 0.548000 0.737632 0.910190 0.943415 0.000000 0.994591 0.997773
        // 0.544000 0.738136 0.924542 0.944812 0.563753 0.994729 0.996054
        // 0.556000 0.740211 0.919053 0.945792 0.000000 0.999281 0.990547
    test_xgboost_from_file(test_data_normalsets);
    
    std::cout << "==== Done ====" << std::endl;
    return 0;
}

3. 注意

注意: test data 需要和训练模型时的数据保持一致, 即经过相同的预处理(若有)

XGBoosterPredict() / 参数说明:

 
int XGBoosterPredict	(	
    BoosterHandle 	handle,
    DMatrixHandle 	dmat,
    int 	option_mask,
    unsigned 	ntree_limit,    
    int 	training,
    bst_ulong * 	out_len,
    const float ** 	out_result 
)

handle：句柄

dmat：数据矩阵

option_mask：选项的位掩码，用于预测，可能的取值为 0: 正常预测 1: 输出边缘值而不是转换后的值 2: 输出树的叶子索引而不是叶子值，注意，叶子索引在每棵树中是唯一的 4: 输出单个预测的特征贡献

ntree_limit：限制用于预测的树的数量，这仅适用于提升树，当参数设置为0时，我们将使用所有树 training：预测函数是否用作训练循环的一部分。

可以在两种情况下运行预测：给定数据矩阵 X，从模型中获取预测 y_pred。获取用于计算梯度的预测。例如，DART 提升器在训练期间执行了 dropout，由于被舍弃的树，预测结果与正常推断步骤获取的结果不同。

对于第一个场景，设置 training=false。对于第二个场景，设置 training=true。第二个场景适用于定义自定义目标函数时。

out_len：用于存储返回结果的长度

out_result：用于设置指向数组的指针

参考:

将基于python训练得到XGBoost模型，用于C++环境推理的示例Demo
- GitHub - Outliers1106/XGBoost-py2cpp
- Xgbboost: cpp调用: GitHub - EmbolismSoil/xgboostpp: 将XGBoost c api封装成c++接口
官方说明文档: Installation Guide — xgboost 2.0.3 documentation

人工智能 Python C++XGBoost

转载原出处：http://t.csdnimg.cn/1Tdgg

打赏 0

上一篇：CUDA_cudaFree_释放Stream_cudaError_t 错误类型码解释

机器学习_XGBoost模型_用C++推理示例Demo

惊鸿一博

1. 需求

2. 代码实现

3. 注意

为你推荐

精选自然语言处理从入门到应用——自然语言处理（Natural Language Processing，NLP）基础知识

精选DI-engine强化学习入门（七）如何自定义神经网络模型

从零实现移动机器人目标识别与跟踪

TensorFlow学习之TensorBoard使用方法

python实现无监督聚类后的匈牙利匹配

CUDA编程入门极简教程

关于作者

惊鸿一博

19

0

502

2

C++_const与指针_指向常量的指针(const int* p) 对比常量指针 (int* const p = &a)；

精选SLAM_相机与imu的融合基础知识

点云投影_激光点云变换到图像平面并保存成int16灰度图&一帧激光点云+一张RGB图像得到彩色点云

相关推荐

深度强化学习专栏 —— 5. 使用ray的tune组件优化强化学习算法的超参数

第七十三篇：从ADAS到自动驾驶（六）：可行驶区域检测

精选python自然语言处理（NLP）1------中文分词1，基于规则的中文分词方法

精选【阅读笔记】概率预测之DeepAR(含Pytorch代码实现)

精选thrust工程化学习(一)----点云并行CUDA快速入门指南

Two-Phase Kernel Estimation for Robust Motion Deblurring

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

机器学习_XGBoost模型_用C++推理示例Demo

惊鸿一博

1. 需求

2. 代码实现

3. 注意

为你推荐

精选自然语言处理从入门到应用——自然语言处理（Natural Language Processing，NLP）基础知识

精选DI-engine强化学习入门（七）如何自定义神经网络模型

从零实现移动机器人目标识别与跟踪

TensorFlow学习之TensorBoard使用方法

python实现无监督聚类后的匈牙利匹配

CUDA编程入门极简教程

评论（0）

关于作者

惊鸿一博

19

0

502

2

C++_const与指针_指向常量的指针(const int* p) 对比 常量指针 (int* const p = &a)；

精选SLAM_相机与imu的融合基础知识

点云投影_激光点云变换到图像平面并保存成int16灰度图&一帧激光点云+一张RGB图像得到彩色点云

相关推荐

深度强化学习专栏 —— 5. 使用ray的tune组件优化强化学习算法的超参数

第七十三篇：从ADAS到自动驾驶（六）：可行驶区域检测

精选python自然语言处理（NLP）1------中文分词1，基于规则的中文分词方法

精选【阅读笔记】概率预测之DeepAR(含Pytorch代码实现)

精选thrust工程化学习(一)----点云并行CUDA快速入门指南

Two-Phase Kernel Estimation for Robust Motion Deblurring

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

C++_const与指针_指向常量的指针(const int* p) 对比常量指针 (int* const p = &a)；

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板