【原】C++11并行计算 — 数组求和

  • 时间:
  • 浏览:0
  • 来源:十分时时彩_十分时时彩网投平台_线上十分时时彩投注平台

本文转载请注明出处 —— polobymulberry-博客园

0x00 - 前言


最近想优化ORB-SLAM2,准备使用并行计算来提高其中ORB特征提取的传输速率。之前 对并行计算方面一窍不通。借此肯能,学习一下基本的并行编程。

在选折 并行编程的工具时,不能考虑以下问题报告 :即该工具尽量不须使用与平台相关的API,如iOS端的GCD(Grand Central Dispatch),肯能希望系统线程池池具有很强的移植性。一现在现在开始帮我到的必须有有一种选折 ,一个 是以TBB和OpenMP为首的第三方系统线程池池库,那我是原生系统线程池池库。其中TBB和OpenMP对于Xcode的支持就有很好,原生系统线程池池库又依赖于系统平台,本来 尝试后都放弃了。之后想到C++11肯能从语言层面支持了多系统线程池池开发,也本来 提供了thread库,于是抱着试一试学一学的态度就入坑了。

并行计算中一个 很经典的案例本来 数组求和,网络上有本来 介绍C++11的thread使用、源码分析的文章,不过使用C++11进行数组求和并行计算的示例却很少,本来 才有了这篇博文。

0x01 - 代码解析


在iOS系统使用C++11进行开发。

//
//  ViewController.m
//  TestDispatch
//
//  Created by poloby on 2017/1/7.
//  Copyright © 2017年 polobymulberry. All rights reserved.
//

#import "ViewController.h"
#include <iostream>
#include <thread>

using namespace std;

// 作为求和函数的参数
// 封装了求和函数的输入和输出
typedef struct ThreadArg {
    long long base;     // 从base~base+length数列求和
    long long length;
    long long sum;      // 将上述数列的和存储在sum中
}ThreadArg;

void sum(ThreadArg *arg)
{
    long long begin = arg->base;
    long long end = arg->base + arg->length;
    long long sum = 0;
    // 不须直接使用for(long long i = arg->base; i < arg->base + arg->length)
    // 本来
要使用arg->sum += i;
    // 肯能指针的读取比普通栈的读取不能多花费一点时间
    for (long long i = begin; i < end; ++i) {
        sum += i;
    }
    arg->sum = sum;
}

@interface ViewController ()

@end

@implementation ViewController

- (void)viewDidLoad {
    [super viewDidLoad];

    // 计算1~count数列之和
    const long long count = 60

0000000;
    
    // 单系统线程池池常用依据
    NSDate *commonMethodDate = [NSDate date];
    long long commonMethodSum = 0;
    for (long long i = 0; i < count; ++i) {
        commonMethodSum += i;
    }
    // 计算单系统线程池池使用时间
    double commonMethodDuration = [[NSDate date] timeIntervalSinceDate:commonMethodDate];

    NSLog(@"Common method spend time = %fms, sum = %lld", commonMethodDuration * 60

0, commonMethodSum);
    
    // 并行计算依据
    // 将1~count数列平均分为threadCount组,求解每组数列之和,再将其相加得到总和
    NSDate *parallelMethodDate = [NSDate date];
    // 设置并行系统线程池池数目
    const int threadCount = 2;
    thread threads[threadCount];
    ThreadArg args[threadCount];
    // 初始化系统线程池池及其参数
    for (int i = 0; i < threadCount; ++i) {
        long long offset = (count / threadCount) * i;
        args[i].base = offset;
        args[i].length = MIN(count - offset, count / threadCount);
        threads[i] = thread(sum, &args[i]);
    }
    
    // 启动系统线程池池并等待图片系统线程池池退出
    for (int i = 0; i < threadCount; ++i) {
        threads[i].join();
    }
    
    long long parallelMethodSum = 0;
    // 将每组数列之和相加得到总和
    for (int i = 0; i < threadCount; ++i) {
        parallelMethodSum += args[i].sum;
    }
    
    // 计算多系统线程池池使用时间
    double parallelMethodDuration = [[NSDate date] timeIntervalSinceDate:parallelMethodDate];
    
    NSLog(@"Parallel method spend time = %fms, sum = %lld", parallelMethodDuration * 60

0, parallelMethodSum);
}

@end

0x02 - 结果分析


Xcode8.2.1+iPhone6手机手机4 7模拟器+1~60 0000000数列之和:

系统线程池池数目 2 4 8
多系统线程池池耗时 1921.2560 26ms 981.8560 8ms 684.60 60 35ms
单系统线程池池耗时 3171.6960 34ms 3472.517014ms 3447.206974ms

Xcode8.2.1+iPhone6手机手机4 7模拟器+1~60 00数列之和:

系统线程池池数目 2 4 8
多系统线程池池耗时 0.279963ms 0.212014ms 0.297010ms
单系统线程池池耗时 0.038981ms 0.027955ms 0.0360 8ms

可见多系统线程池池有有一种本来能消耗一定的资源,本来 必须在系统规模较大的情况表下不能取得显著的性能提升。

0x03 - 注意事项


1. thread调用类的成员函数:

thread memberFuncThread(&ClassName::MemberFuncName, this, arg1, arg2...);

2. thread传递引用参数:

不能使用std::ref进行包装,详见thread - 传递引用参数。