透过 OpneNI 合并 Kinect 深度以及彩色影像数据

在前一篇的《透过OpneNI 读取Kinect 深度影像数据》里，已经解释过如何在 PC 上透过 OpenNI 来读取Kinect 的深度图了。而这一篇，则是进一步、同时读取它的深度图，以及一般的彩色影像、并将之做位置上的校正、合并。为了做到这个目的，除了上一篇有用到的 xn::DepthGenerator 外，这一篇还会用到 xn::ImageGenerator 来读取Kinect 的彩色影像数据；而另外为了修正两个摄影机的视角不同，也会用到 xn::AlternativeViewPointCapability 这个特别的Capability。

而由于这边的程序代码是基于上一个程序所修改的，所以在重复的地方，Heresy 不打算重复说明了，请自行回去参考上一篇文章的部分。而接下来，就直接先看程序代码的内容：

#include <stdlib.h>

#include <iostream>

#include <string>

#include <XnCppWrapper.h>

using namespace std;

void CheckOpenNIError( XnStatus eResult, string sStatus )

  if( eResult != XN_STATUS_OK )

    cerr << sStatus << " Error : " << xnGetStatusString( eResult ) << endl;

int main( int argc, char** argv )

  XnStatus eResult = XN_STATUS_OK;

  // 2. initial context

  xn::Context mContext;

  eResult = mContext.Init();

  CheckOpenNIError( eResult, "initialize context" );

  // 3. create depth generator

  xn::DepthGenerator mDepthGenerator;

  eResult = mDepthGenerator.Create( mContext );

  CheckOpenNIError( eResult, "Create depth generator" );

  // 4. create image generator

  xn::ImageGenerator mImageGenerator;

  eResult = mImageGenerator.Create( mContext );

  CheckOpenNIError( eResult, "Create image generator" );

  // 5. set map mode

  XnMapOutputMode mapMode;

  mapMode.nXRes = 640;

  mapMode.nYRes = 480;

  mapMode.nFPS = 30;

  eResult = mDepthGenerator.SetMapOutputMode( mapMode );

  eResult = mImageGenerator.SetMapOutputMode( mapMode );

  // 6. correct view port

  mDepthGenerator.GetAlternativeViewPointCap().SetViewPoint( mImageGenerator );

  // 7. tart generate data

  eResult = mContext.StartGeneratingAll();

  // 8. read data

  eResult = mContext.WaitNoneUpdateAll();

  if( eResult == XN_STATUS_OK )

    // 9a. get the depth map

    const XnDepthPixel*  pDepthMap = mDepthGenerator.GetDepthMap();

    // 9b. get the image map

    const XnUInt8*    pImageMap = mImageGenerator.GetImageMap();

  // 10. stop

  mContext.StopGeneratingAll();

  mContext.Shutdown();

  return 0;

ImageGenerator

基本上，这边的程序架构和之前单纯读取深度影像的范例是相同的。不同的地方在于，这边除了建立用来读取深度的 xn::DepthGenerator 这个node、mDepthGenerator 外，也另外建立了一个用来读取彩色影像用的 node，也就是形别是 xn::ImageGenerator 的物件 mImageGenerator。而它的使用方法基本上和 xn::DepthGenerator是相同的，一样是先宣告出他的对象后，再透过 Create() 这个成员函式来建立；程序写法的部分，可以参考上方「4. create image generator」的部分。

而同样的，在这边 Heresy 也是把彩色影像的输出模式，设定为 640 x480 @ 30FPS；而 xn::ImageGenerator 设定输出模式的方法和 xn::DepthGenerator 一样，也是呼叫 SetMapOutputMode() 做设定就可以了。（上方「5. set map mode」的部分。）

取得影像数据

相较于 xn::DepthGenerator 是透过 GetDepthMap() 这个函式来取得深度的影像，xn::ImageGenerator 则是透过 GetImageMap() 这个函式来取得彩色的影像数据。而在默认的情况下，这样取得的影像数据会是一个型别是XnUInt8（实际上就是 unsigned char）的const 指标，指向一个一维数组。而这个数组的大小会是 640 x 480 x 3，每三个为一组、分别代表他的 RGB 的值。

另外，也可以透过 GetRGB24ImageMap() 这个函式，来取得 XnRGB24Pixel 这种封装好的格式，不过实际使用上差异不大就是了。而如果有需要的话，image generator 也可以透过 SetPixelFormat()，来修改每一个像素的数据形式，不过在这边就不细提。

视角修正

接下来比较特别的地方，则是「6. correct view port 」的部分。这边程序的目的，是要修正两个传感器取得的画面坐标，让两者画面的视角一致。为什么要做这件事呢？因为 Kinect 的深度摄影机和彩色摄影机是在不同的位置，而且镜头本身的参数也不完全相同，所以其实两个摄影机所取得的画面，是会有些微的差异的。下面就是在不修正的情况下，所抓到的画面（左边是彩色、右边是深度）：

直接看的话感觉好像差不多？不过仔细看的话，是可以发现两张图的可视范围是不一样的～彩色摄影机的可视范围，基本上是比深度摄影机大一些的；而如果把两张图重迭在一起，看起来会更明显。右边的图就是直接把两张图重迭在一起的结果，可以很明显地看出来，有很多地方都没有办法对应得很好，像是天花板上的日光灯罩和机柜上的东西，都很明显地看的出来有出入。

为了解决这个问题，OpenNI 有提供一个名为「Alternative View」的 Capability，可以帮助使用 OpenNI 的程序开发者，快速地修正这种视角上的不同；不过这项功能，基本上是要有支持的 production node 才可以用的就是了。

Alternative View 这个capability 的型别是 xn::AlternativeViewPointCapability，可以直接透过呼叫 ProductionNode 的「GetAlternativeViewPointCap()」来取得用来操作这项 capability 的对象；基本上 OpenNI 的所有 capability，都是以这样的形式来使用的。而以 xn::AlternativeViewPointCapability 来说，他有提供SetViewPoint() 这个函式，可以把其他的 production node 传进去、把目前这个 node 的视角改为指定 node 的视角。

而 Heresy 这边实际写成程序代码，就是：

mDepthGenerator.GetAlternativeViewPointCap().SetViewPoint( mImageGenerator );

这样写的意思，就是把 mDepthGenerator 这个 depth generator 的视角、设定成和 mImageGenerator 一样了。（注：反过来想让 image generator 根据 depth generator 调整的话，OpenNI 会当掉…）

而加上这一行后， depth generator 所抓到的画面，就会变成左下方这样的图。如果和之前没有执行过视角调整的结果相比，可以发现调整过后的结果周围的黑边明显地比较大，同时也有一些几何上的修正（四边有稍微内凹）；而这样取得的结果再和彩色影像重迭在一起（右下图），则可以发现位置变得相当一致，不会有之前画面内东西不一致的问题了！

所以如果有需要要将深度和彩色影像做整合的话，应该就要记得做视角修正的动作，以避免对应的位置出错。

这一篇文章大概就先写到这里了。基本上，这边主要应该算是在讲 Alternative View 这个 capability 了～而实际上，如果有需要的话，可能也可以考虑使用 Frame-Sync 这个 capability，来让深度影像与彩色影像之间的时间差更小；不过就 Heresy 目前简单的测试看来，应该差异不大就是了，如果有需要的人，可以自己玩看看了～

透过 OpneNI 合并 Kinect 深度以及彩色影像数据

ImageGenerator

取得影像数据

视角修正

继续阅读

程序员职业规划：让自己变得重要(转)

kylin jmx监控端口配置

在职阿里6年，一个29岁女程序员的心声

学习编程的一些体会

腾讯视频播放内容下载流程

黑马程序员-Socket网络编程

哈理工oj Touring （最短路 dij算法邻接表 + 队列）

管理岗位软件测试能月薪5万吗？具备哪些能力？

轻松做性能测试，月入3万的主流测试工具大揭秘

女生可以做软件测试吗？

《信息系统项目管理师》之一：基础知识

虚拟主机会影响到SEO吗

How to Map Network Drives From the Command Prompt in Windows

复习网络体系结构与网络协议

oracle安装笔记--win7 Windows server 2008 安装64位 oracle10g

面试题解析：你接口测试是怎么做的？