tbdr下 msaa增加的开销
首先msaa 一层只计算一次fs (不考虑metal2 对msaa的优化的情况下,不考虑一些先进的平台只sample边缘这种状况,假设所有pixel都参与)
(严格说metal的描述 不是只考虑边缘 而是merge了一样的sample数量
因为覆盖一层只算一次ps
但depth和stencil是一个pixel算 多个subsample的 4x算4个
所以计算量增加的就在这里了
数据量的话
depth color都要 写4个 只是 可以通过设置让这部分onchip tbdr省的只是这里的数据 如果带宽。。。
insight里有对比 tbdr和immediate这部分的差异
因为chipmem大小一定 4x会导致更多的tile
msaa on 比msaa off (非tbdr时)的开销增加 有这样一部分:
第二层只cover 一个subpixel的时候
off 不算ps
on 会算一次ps