基本的device类型:hal:硬件渲染(发布)。这也不是直接访问硬件驱动,而是访问在上一层的hal。(在顶点处理过程中,如果硬件处理失败,可尝试混合处理及纯软处理,设定标志d3dcreate_mixed_vertexprocessing)
soft软件渲染(但是这种软渲染并不一定拥有同当前硬件相同的渲染能力,所以要经常检查)
ref完全精密的实现所有特征的软渲染可以,可用于验证feature,使用那些还没被做到硬件的feature,也可以用来验证是不是硬件驱动有bug,因为它是最规范完整的按feature来渲染。
xp与vista的显示的一些问题
1.在安全桌面下:如屏保、锁定、未登入状态等,hal device是不能访问的,d3d9的device会创建失败。但是vista可以使用系统service来创建
2.远程桌面:xp下不能再远程桌面上创建device vista可以通过remote desktop session来创建
1 枚举硬件
idirect3d9:: getadaptercount()获取显卡数量,d3d9中的显卡表示为0-getadaptercount()-1的整数,主显卡也可用d3dadapter_default表示。
另外可以用idirect3d9::<code>getadapteridentifier</code><code>获取显卡的厂商类型等信息。</code>
2.获取指定显卡支持的显示模式
idirect3d9::enumadaptermodes.
idirect3d9::getadapterdisplaymode可获取硬件当前的显示模式
3.(可选)查询设备是否支持要用到的一些硬件加速,他还能查询设备是否支持swap chain
idirect3d9::checkdevicetype(窗口模式可省)
4.获取当前硬件的渲染能力
idirect3d9::getdevicecaps
5,当渲染到一个surface时,通常要检查这个surface的格式是是否可以用于texture、rendertarget、depth-stenil
buffer
idirect3d9::checkdeviceformat.(窗口模式可省)
6.查询一个硬件是否支持某种多采样技术(反走样)
idirect3d9::checkdevicemultisampletype(窗口模式可省)
较高的多采样和多backbuffer会严重增加显存的使用
创建操作只能在当前激活的窗口显示的同一个线程中
1.创建一个d3d object,(这个创建多个会严重影响性能)。
idirect3d9 *direct3dcreate9(uint
sdkversion),失败返回null。参数永远是d3d_sdk_version
2.创建device
idirect3d9::createdevice(
[in] uint adapter,--显卡
[in] d3ddevtype devicetype, --类型
[in] hwnd hfocuswindow,--窗口
[in] dword
behaviorflags,
[in, out] d3dpresent_parameters *ppresentationparameters,--设备的主要参数
[out, retval] idirect3ddevice9 **ppreturneddeviceinterface
)
*uint adapter显卡:d3dadapter_default为主显卡
* d3ddevtype:
<code> </code> d3ddevtype_hal = 1, hal
d3ddevtype_nullref = 4,--只创建资源,所有要求传入d3ddevtype类型参数的函数都会失败
d3ddevtype_ref = 2,ref
d3ddevtype_sw = 3,使用插件的软渲染,插件要用,idirect3d9::registersoftwaredevice注册
* behaviorflags:
d3dcreate_adaptergroup_device只对主显卡有效,让设备驱动输出给它所拥有的所有显示输出
d3dcreate_disable_driver_management代替设备驱动来管理资源,这样在发生资源不足时d3d调用不会失败
d3dcreate_disable_printscreen:不注册截屏快捷键,只对direct3d 9ex
d3dcreate_disable_psgp_threading:强制计算工作必须在主线程上,vista以上有效
d3dcreate_enable_presentstats:允许getpresentstatistics收集统计信息只对direct3d 9ex
d3dcreate_fpu_preserve;强制d3d与线程使用相同的浮点精度,会降低性能
d3dcreate_hardware_vertexprocessing:指定硬件进行顶点处理,必须跟随d3dcreate_puredevice
d3dcreate_mixed_vertexprocessing:指定混合顶点处理
d3dcreate_software_vertexprocessing:指定纯软的顶点处理
d3dcreate_multithreaded:要求d3d是线程安全的,多线程时
d3dcreate_nowindowchanges:拥有不改变窗口焦点
d3dcreate_puredevice:只试图使用纯硬件的渲染
d3dcreate_screensaver:允许被屏保打断只对direct3d 9ex
d3dcreate_hardware_vertexprocessing, d3dcreate_mixed_vertexprocessing, and d3dcreate_software_vertexprocessing中至少有一个一定要设置
*d3dpresent_parameters ppresentationparameters
typedef struct d3dpresent_parameters {
uint backbufferwidth;
uint backbufferheight; --back buffer的长宽注意如果是全屏模式必须等于显卡的其中一种分辨率如果是窗口不填就用这个窗口的大小
d3dformat backbufferformat; --backbuffer的格式(主要是颜色格式),必须与当前的render target相同。在窗口模式d3dfmt_unknown可以直接使用去匹配当前的显示格式,全屏不行
uint backbuffercount; --backbuffer的数量0 -d3dpresent_back_buffers_max之间,0代表创建一个(就是创建到0号缓存),函数调用返回失败时,将返回实际可以创建的backbuffer的数量
d3dmultisample_type multisampletype;--只有swapchain是d3dswapeffect_discard才能使用多采样(用于反走样),否则都必须设置d3dmultisample_type
dword multisamplequality; -多采样的质量,0-checkdevicemultisampletype之间,越大越高质量
d3dswapeffect swapeffect;--swapchain在交换buffer时的参数,swapchain要按照顺序从backbuffer
n 往前到front buffer 交换数据
hwnd hdevicewindow; --窗口;窗口模式,就是显示的窗口,如果null,则使用当前的激活窗口。全屏模式,主显示器使用当前的激活窗口,其他显示器必须使用一个确定的窗口。当窗口重置时back buffer不会被重置。
bool windowed; --是否全屏
bool enableautodepthstencil;--是否让d3d自动管理depth buffer,如果true则下一个参数必须是个正确的参数
d3dformat autodepthstencilformat;
dword flags; --一些在present显示时的参数
uint fullscreen_refreshrateinhz;--全屏时硬件刷新屏幕的频率,enumadaptermodes返回的模式中选其一,窗口模式要填0,
uint presentationinterval; backbuffer交换给frontbuffer的最大频率
}
*d3dswapeffect 交换链参数
d3dswapeffect_discard = 1,
当使用flip和copy的时候,present会保证不影响每个buffer的内容,这会带来大量的显存开销,同时使用这个标记可以采取效率最高的交换方式,当buffer的东西被有效显示后,某些buffer里的数据就不保证正确性了,所以在present之前一定要先update整个backbuffer。如果采样方式不是用的d3dmultisample_none一定都要用这个标记。
d3dswapeffect_flip = 2,见1.3.1
d3dswapeffect_copy = 3,见1.3.1
d3dswapeffect_overlay = 4,
使用显存中特定的一块区域(overlay)当使用这块区域时不会发生从显存copy到内存中的操作,效率高,这只可以用于win7之后并且是d3d9ex的
d3dswapeffect_flipex = 5,
d3dswapeffect_flip的更高效模式只可以用于win7之后并且是d3d9ex的
*dword flags
d3dpresentflag_deviceclip
限制了window模式下客户端区域present操作的结构,暗示了back buffer包含有video。
d3dpresentflag_discard_depthstencil
在调用present后discard depth/stencil surface里面的内容。这样就使depth/stencil
surface是一个可写的surface。如果depth/stencil surface的格式是d3dfmt_d16_lockable或者
d3dfmt_d32_lockable设置这个标记将会返回一个错误。
d3dpresentflag_lockable_backbuffer
backbuffer可以被锁定
d3dpresentflag_noautorotate
不允许自动旋转显示器自动选择显示内容提高效率 d3d9ex可用
d3dpresentflag_video
说明backbuffer
有video
*uint presentationinterval它说明了硬件的显示刷新率与present进行缓存swap的频率的二者的关系,这个参数会影响屏幕的实际的fps等属性。显卡的刷新率不是真的fps,那只是显卡给屏幕的重绘频率,真正的fps是实际的swap的频率结合显卡的刷新频率,要看屏幕上最终是每秒显示了几次swap交换。
这里是为了解决gpu和显示输出对frontbuffer的冲突解决方式
d3dpresent_donotwait
present不被hal device处理,如果硬件在忙于处理或等待垂直同步(防止被撕裂),那么执行present会马上失败返回,即不发生交换缓存操作。也就是硬件忙的时候会保证垂直同步而不进行重绘制,它可能是可以保证画面不会出现撕裂,但是是以卡帧为代价。它的意思也是不要去锁定fps。
d3dpresent_interval_one/~four present等待垂直同步,但是保证present最多每1~4帧被打扰一次。这里是提高帧率与放置撕裂的权衡
d3dpresent_interval_immediate
能present
就立即present,完全不管垂直同步了,最贴近实际的swap帧率。
d3dpresent_linear_content
back buffer format is
x8r8g8b8.
其中
d3dpresent_interval_default
基本机遇是d3dpresent_interval_one
垂直同步质量与fps的关系(越往下fps变高,垂直同步变差)
d3dpresent_donotwait
d3dpresent_interval_one
d3dpresent_interval_two
d3dpresent_interval_。。
d3dpresent_interval_immediate
当程序要退出或者需要废弃当前device重建新的时候,要清理d3d9资源,调用
void cleanup()
{
if( g_pd3ddevice != null)
g_pd3ddevice->release();
if( g_pd3d != null)
g_pd3d->release();