[Hecher et al. 2014Hecher, M., Bernhard, M., Mattausch, O., Scherzer, D. and Wimmer, M. 2014. A comparative perceptual study of soft-shadow algorithms. ACM Trans. Appl. Percept. 11, 2. 10.1145/2620029. https://www.cg.tuwien.ac.at/research/publications/2014/hecher-2014-MH/hecher-2014-MH-draft.pdf.]
訳注:これはdraft版です。
1. はじめに(INTRODUCTION)#
ソフトシャドウのためのリアルタイムアルゴリズムは長年の間リアルタイムレンダリング研究の主要な部門であった。その目標は60フレーム毎秒の時間予算内で物理的なソフトシャドウの外観のもっともらしい近似を提供する賢い方法を見つけることである。この成熟した分野において、競合するアルゴリズムの間の差異はしばしば極めて微妙である(図1)。伝統的に、シャドウアルゴリズムは2つ3つの選ばれたシーンで参考解とその出力を比較したり、ピクセル毎の差異を強調したりすることによって評価してきた。さらに、その根拠を判断するのは通常、シャドウの専門家のグループである。しかし、これは、比較する参考解を持たず、専門家でない、典型的なユーザがシャドウを体験する方法ではない。
(図1:4つの異なるソフトシャドウアルゴリズムでレンダリングされたシーン。その結果は非常に似ているが、そのソフトシャドウ領域において微妙な差異がある。問題は、ユーザがこれらの差異を知覚できるか否か、または、彼らがground truthな解法(GT)をBackprojection(BT)のような物理ベースのリアルタイム近似、または、Percentage-Closer Soft Shadows(PS)やPercentage-Closer Filtering(PF)のような単純な非物理的解法と区別できるかどうかである。)
このため、与えられるシャドウアルゴリズムが経験済みのユーザ、専門家のユーザ、参考解と共に行う人と比較して典型的なユーザにどれだけもっともらしく見えるか、および、詳しくないユーザが2つの定性的に異なるシャドウアルゴリズムの種類の間の知覚的な差異を おおむね 判断できるか否かを問うことをこの研究の主な動機としてきた。これらの疑問は様々な関連するシャドウ特性に関して系統的に評価しなければならない。特に、我々は、人間の知覚が特定の環境においてソフトシャドウアルゴリズムのある特徴に対してどれだけ敏感であるかの疑問を調査しなければならない。
驚くべきことに、シャドウの柔らかさを正しく推定する能力(例えば、正しい光条件を判断するため)は、我々の認識では、科学的評価の対象になってこなかった。これは、本質的な奥行きの手がかりとしてのシャドウの重要性や観測者にシーンを現実的に見せる方法が良く知られていることを考慮すれば、かなりの注目に値することである。
この論文の貢献は以下のことである。
- 入念に選ばれた様々なシーンカテゴリの中で物理的半影のある種の重要な特性を近似する能力に関してソフトシャドウアルゴリズムの種類を体系的に比較する初めての包括的研究。
- ゲームデザイナや研究者のためのガイドラインとして使われる可能性がある、未経験者、経験者、および、専門家のソフトシャドウの知覚に関する新しい洞察。例えば、物理ベースのモデルに対する全体的な優先傾向はリアルタイムにおいてより高い正確さを求めて努力することが実用的な妥当性を有するかもしれないことを示す。
- 一般におけるソフトシャドウの研究デザインと見た目のソフトシャドウの実験に関する新たな事実。例えば、異なる質問がソフトシャドウのユーザの判断にどれだけ影響を与え得るか。また、どのシーンカテゴリやソフトシャドウの特徴がソフトシャドウの比較に適しているか、または、どれが適していないか(驚くことに、vegetationのシーンは適していないことが判明した)。
1.1. 研究の範囲と制限(Study Scope and Limitations)#
我々の主な目標は独立変数の管理可能な範囲を探り、ワーストケースのシナリオにおいて徹底的にそれらを調査することであった。特に、我々はソフトシャドウのアルゴリズムが半影の領域の物理的特性をどれだけ上手く捕らえられているかを判断し、半影の差異に可能な限り重きを置く。我々は、それらの半影の近似品質の公正な比較を提示するため、できる限り、選ばれたアルゴリズムの低レベルレンダリングのアーティファクトを回避する。アニメーションの計算は追加の自由度を必要とし、ひとつの研究の範囲内で適切に扱うことが難しいと思われたため、静的なソフトシャドウのみが調査される。我々は、誤ったソフトシャドウの潜在的マスキングを回避するためのシーンのひとつを除いて、すべてでテクスチャを使用しない[Ferwerda et al. 1997Ferwerda, J. A., Shirley, P., Pattanaik, S. N. and Greenberg, D. P. 1997. A model of visual masking for computer graphics. Proceedings of the 24th annual conference on computer graphics and interactive techniques 143–152. 10.1145/258734.258818. https://doi.org/10.1145/258734.258818.]。しかし、我々は、関与する要因に関する展望を得るため、我々の研究にテクスチャを伴う現実的なゲーム型のシーンをひとつ含めた。この研究のもうひとつの制限は、各シーンにおいて同じ大きさの1つの光源が使われ、(ゲーム型のシーンを除いて)レンダリングされるイメージにおいて可視であった、ということである。しかし、光源の大きさや形状の違いは同じ比率でシャドウ全体における半影の大きさを変化させるにすぎず、現在の結果はユーザがシャドウにおける相対的な差異、すなわち、半影の変化の仕方をより良く理解していることを示している。
2. 研究の概要(STUDY OVERVIEW)#
我々は、ユーザが様々な品質の近似の間の差異を知覚できるか否か、そして、どの程度知覚できるかを明らかにするため、一対比較の手法を用いた知覚研究を行った。その実験のもうひとつの目的はソフトシャドウにおけるどの特徴が知覚される品質を大幅に改善するかを解明することである。ソフトシャドウは複合的なライティング現象であるので、比較作業は挑戦的であり、ground truthのリファレンスを示すことによって楽にすることができる。しかし、ground truthのリファレンスとの比較は人工的な設定であり、その結果は典型的なユーザのソフトシャドウを判断する能力を恐らく過剰に推定する。一方で、我々はこの作業におけるパフォーマンスがユーザ体験の問題ではないかと疑っている。未経験のユーザはソフトシャドウに関する知識を持つ経験者と比べてもっと低い感受性を持っているかもしれない。故に、我々は、未経験者、経験者、熟達者、と定義した3つのユーザ体験レベルを調査した。これら3つのレベルは、各ユーザタイプの振る舞いを3つの連続したフェーズの1つでシミュレートする研究パラダイムによって調査された。初期未経験ユーザは学習フェーズを通して経験者になってもらった。そこでは、ground truthのリファレンスが提供された。これらの結果がソフトシャドウレンダリングの本物の専門家とどのように比較されるかを見つけるため、我々はソフトシャドウや大域照明の分野での科学文献の発表経験を持つ人々を含めて、彼らの結果を非専門的なユーザと比較する。
個々のソフトシャドウ近似の間の差異はかなり微妙である可能性があるので、特に未経験者の知覚では、我々は二肢強制選択比較の一般的に使われる概念が ユーザの整合性 を減少させることによってその研究の情報価値を制限し得るという不利益を持つ可能性があることを発見した。故に、我々は中立的な選択を捨てる代替の概念を用いる。
3. 関連研究(RELATED WORK)#
3.1. シャドウと照明の知覚(Perception of shadows and illumination)#
シャドウの知覚はいくつかの心理学研究のトピックであった。Wanger et al.はシャドウがオブジェクトの空間的関係性に対する重要な見た目の手がかりであることを示した[Wanger 1992Wanger, L. 1992. The effect of shadow quality on the perception of spatial relationships in computer generated imagery. Proceedings of the 1992 symposium on interactive 3D graphics 39–42. 10.1145/147156.147161.; Wanger et al. 1992Wanger, L.R., Ferwerda, J.A. and Greenberg, D.P. 1992. Perceiving spatial relationships in computer-generated images. IEEE Computer Graphics and Applications 12, 3, 44–58. 10.1109/38.135913.]。 Knill et al. [1997Knill, D. C., Mamassian, P. and Kersten, D. 1997. Geometry of shadows. Journal of the Optical Society of America A, Optics and Image Science 14, 12, 3216–3232. 10.1364/JOSAA.14.003216. https://opg.optica.org/josaa/abstract.cfm?URI=josaa-14-12-3216.] はシャドウが光源の方向とその下地となる表面の形状に関する情報を提供し得ることを示すことができた。他の研究ではオブジェクトの接触を知覚するためのシャドウの役割[Hu et al. 2000Hu, H.H., Gooch, A.A., Thompson, W.B., Smits, B.E., Rieser, J.J. and Shirley, P. 2000. Visual cues for imminent object contact in realistic virtual environments. Proceedings visualization 2000. VIS 2000 (cat. no.00ch37145) 179–185. 10.1109/VISUAL.2000.885692.]や相互反射[Madison et al. 2001Madison, C., Thompson, W., Kersten, D., Shirley, P. and Smits, B. 2001. Use of interreflection and shadow for surface contact. Perception & Psychophysics 63, 2, 187–194. 10.3758/BF03194461.]に焦点を当てた。 Jarabo et al. [2012Jarabo, A., Eyck, T. V., Sundstedt, V., Bala, K., Gutierrez, D. and O'Sullivan, C. 2012. Crowd light: Evaluating the perceived fidelity of illuminated dynamic scenes. Computer Graphics Forum 31, 2pt3, 565–574. 10.1111/j.1467-8659.2012.03057.x. https://graphics.unizar.es/projects/crowdsEG12/downloads/crowdlight_pres_eg12.pdf.] はジオメトリの複雑さや色のような要因が動的な群衆を伴う仮想シーンにおいて照明の知覚的忠実性にどれだけ影響を与えるかを評価した。
人間の感受性が低いが故により低品質のシャドウで十分である所の領域におけるソフトシャドウレンダリングを高速化する方法についての以前の研究があった[Sattler et al. 2005Sattler, M., Sarlette, R., Mücken, T. and Klein, R. 2005. Exploitation of human shadow perception for fast shadow rendering. Proceedings of the 2nd symposium on applied perception in graphics and visualization 131–134. 10.1145/1080402.1080426. https://cg.cs.uni-bonn.de/backend/v1/files/publications/sattler-2005-exploitation.pdf.; Vangorp et al. 2006Vangorp, P., Dumont, O., Lenaerts, T. and Dutré, P. 2006. A perceptual heuristic for shadow computation in photo-realistic images. ACM SIGGRAPH 2006 sketches 102–es. 10.1145/1179849.1179977. https://graphics.cs.kuleuven.be/publications/PHSC/.; Schwarz and Stamminger 2008Schwarz, M. and Stamminger, M. 2008. Quality scalability of soft shadow mapping. Proceedings of graphics interface 2008 147–154. https://michael-schwarz.com/research/publ/files/qsssm-gi08.pdf.]。しかし、これらの研究は特定の種類のアルゴリズムのスケーリングの問題を対処するので補足的である。それに対し、我々は別個の種類のソフトシャドウアルゴリズムの知覚を比較すること、および、様々なソフトシャドウの特徴を扱うことが知覚的品質を向上させるかどうかに関する研究を提供する。
3.2. 研究デザイン(Study design)#
コンピュータグラフィックスは科学として成熟してきているので、コースティクス[Gutierrez et al. 2008Gutierrez, D., Seron, F. J., Lopez-Moreno, J., Sanchez, M. P., Fandos, J. and Reinhard, E. 2008. Depicting procedural caustics in single images. ACM Trans. Graph. 27, 5. 10.1145/1409060.1409073. https://graphics.unizar.es/papers/sAsia08_caustics_LR.pdf.]、トーンマッピング[Ledda et al. 2005Ledda, P., Chalmers, A., Troscianko, T. and Seetzen, H. 2005. Evaluation of tone mapping operators using a High Dynamic Range display. ACM SIGGRAPH 2005 papers 640–648. 10.1145/1186822.1073242. https://helgeseetzen.com/wp-content/uploads/2017/06/HS1.pdf.]、幾何的な歪み[Setyawan and Lagendijk 2004Setyawan, I. and Lagendijk, R. L. 2004. Human perception of geometric distortions in images. Security, steganography, and watermarking of multimedia contents VI 5306, 256 – 267. 10.1117/12.526726.]、image-retargetingアルゴリズム[Rubinstein et al. 2010Rubinstein, M., Gutierrez, D., Sorkine, O. and Shamir, A. 2010. A comparative study of image retargeting. ACM Trans. Graph. 29, 6. 10.1145/1882261.1866186. https://people.csail.mit.edu/mrub/papers/retBenchmark.pdf.]、大域照明[Čadík et al. 2012Čadík, M., Herzog, R., Mantiuk, R., Myszkowski, K. and Seidel, H.-P. 2012. New measurements reveal weaknesses of image quality metrics in evaluating graphics artifacts. ACM Trans. Graph. 31, 6. 10.1145/2366145.2366166. https://resources.mpi-inf.mpg.de/hdr/iqm-evaluation/cadik12iqm_evaluation.pdf.]のような包括的な知覚的研究における様々なグラフィクス的効果の利点を評価することの興味はますます高まっている。我々の研究の構造はこれらの研究に本質的に関連しており、我々は以下に関する差異、および、類似性を議論する。
Ledda et al. [2005Ledda, P., Chalmers, A., Troscianko, T. and Seetzen, H. 2005. Evaluation of tone mapping operators using a High Dynamic Range display. ACM SIGGRAPH 2005 papers 640–648. 10.1145/1186822.1073242. https://helgeseetzen.com/wp-content/uploads/2017/06/HS1.pdf.] の実験では、被験者に対して2つのLCDモニタ上で異なるトーンマッピング・オペレータによって生成されるLDR画像を示し、一方で、参考解としてHDRモニタ上でオリジナルの画像を示した。このアプローチはアルゴリズム処理のパフォーマンスが最適解に対してテストされなければならず、刺激がどのように見えるべきかを被験者が厳密に知っている所のワーストケースのシナリオをもたらすときに有用である。Ledda et al.とは対照的に、 Rubinstein et al. [2010Rubinstein, M., Gutierrez, D., Sorkine, O. and Shamir, A. 2010. A comparative study of image retargeting. ACM Trans. Graph. 29, 6. 10.1145/1882261.1866186. https://people.csail.mit.edu/mrub/papers/retBenchmark.pdf.] の大規模なユーザスタディは参考解を提供しない一対比較を用いる。
我々の研究において、我々は、まず参考解ありで行い、その後、参考解なしで行うという両方のシナリオを含める。そして、これらを用いてソフトシャドウアルゴリズムを評価するためのユーザの専門知識の異なる度合いを模倣する。これは、大域照明とレンダリングアーティファクトの検出のために画像品質メトリクスを計算する、 Čadík et al. [2012Čadík, M., Herzog, R., Mantiuk, R., Myszkowski, K. and Seidel, H.-P. 2012. New measurements reveal weaknesses of image quality metrics in evaluating graphics artifacts. ACM Trans. Graph. 31, 6. 10.1145/2366145.2366166. https://resources.mpi-inf.mpg.de/hdr/iqm-evaluation/cadik12iqm_evaluation.pdf.] と同種のものである。これらの2つのフェーズに加えて、我々はもうひとつの研究フェーズにおいて参考解を示してから達成される学習効果を研究する。また、参考解なしでも行う。
レンダリング手法の知覚を研究するための興味深い代替手法は、もっともらしい大域照明を生成するために可視性の計算において必要となる正確性を調査した Yu et al. [2009Yu, I., Cox, A., Kim, M. H., Ritschel, T., Grosch, T., Dachsbacher, C. and Kautz, J. 2009. Perceptual influence of approximate visibility in indirect illumination. ACM Trans. Appl. Percept. 6, 4. 10.1145/1609967.1609971. https://jankautz.com/publications/indirectvisibility_apgv09.pdf.] によって用いられた。彼らはいわゆるpaired comparison plus category [Scheffé 1952Scheffé, H. 1952. An Analysis of Variance for Paired Comparisons. Journal of the American Statistical Association 47, 259, 381–400. 10.1080/01621459.1952.10501179.]のパラダイムを用いた。好みを答えるのではなく、参加者は類似性の高低を範囲とする事前に定義されたカテゴリの尺度で2つの画像の類似性を採点した。我々の研究でも同様に類似性の推定を得るため、我々は評価に中立的な回答の数を組み込む。
Setyawan and Lagendijk [2004Setyawan, I. and Lagendijk, R. L. 2004. Human perception of geometric distortions in images. Security, steganography, and watermarking of multimedia contents VI 5306, 256 – 267. 10.1117/12.526726.] は一人の被験者の回答の質とすべての被験者の間の合意を解析する。我々は被験者のパフォーマンスや学習フェーズが効果的だったかどうかを評価するために我々の研究にこの概念を採用した。 Akyüz et al. [2007Akyüz, A. O., Fleming, R., Riecke, B. E., Reinhard, E. and Bülthoff, H. H. 2007. Do HDR displays support LDR content? a psychophysical evaluation. ACM Trans. Graph. 26, 3, 38–es. 10.1145/1276377.1276425. https://user.ceng.metu.edu.tr/~akyuz/files/hdrdisplay.pdf.] に従い、我々はTukeyのHSD法[Steel et al. 1997Steel, R. G. D., Torrie, J. H. and Dickey, D. A. 1997. Principles and procedures of statistics : a biometrical approach.]を用いて、有意差を計測できなかったアルゴリズムのグループを見つけ出し、それ故に、それらを匹敵する品質であると判断した。その成果に関して実験の効果をより良く評価および理解するため、我々はdegree of indifferenceと表記する新しい量を導入し(詳細は節7で説明される)、一対比較の結果からworth parameters[Hatzinger and Dittrich 2012Hatzinger, R. and Dittrich, R. 2012. prefmod: An R Package for Modeling Preferences Based on Paired Comparisons, Rankings, or Ratings. Journal of Statistical Software 48, 10, 1–31. 10.18637/jss.v048.i10. https://www.jstatsoft.org/article/view/v048i10.]を計算する。
4. 選ばれるソフトシャドウアルゴリズム(SELECTED SOFT-SHADOW ALGORITHMS)#
リアルタイムでソフトシャドウを近似するアルゴリズムは多岐にわたる[Eisemann et al. 2011Eisemann, E., Schwarz, M., Assarsson, U. and Wimmer, M. 2011. Real-Time Shadows. https://www.realtimeshadows.com/index.html.]ため、適切なサブセットの選択はこの研究の準備において重要なプロセスである。一方で、我々の目的は単純な経験則的手法から高コストだが完全に物理的な手法までの範囲全体を網羅することであった。他方で、我々はひとつの研究で調査するのに適したアルゴリズム数に制限しなければならない。我々は、利用可能な可視性情報を用いて物理的シャドウの現実的な半影を近似する能力に関する、リアルタイムソフトシャドウアプローチの代表的な種類を形成する3つのアルゴリズムを選択し、そして、比較のためにブルートフォースのground truthの解を追加する。我々はリアルタイムソフトシャドウレンダリングに対して実践で使われるほとんどの手法がこれらの基本形式のバリエーションかある種のアーティファクトを隠すことを目的とする調整版であると主張する。また、すべての主要なリアルタイムアプリケーションにおけるこれらの優位性のため、シャドウマッピングに基づくアルゴリズムのみが考慮された。すべての我々のアルゴリズムの見た目の比較は図2で確認できる。
(図2:ソフトシャドウアルゴリズムの見た目の比較。クローズアップは、ヒューリスティクスによって誤魔化すのが最も難しく、それ故に、シャドウアルゴリズム間の見た目の差異のほとんどを占める、penumbra softeningとpenumbra overlapの2つの特性を示している。拡大された画像のコントラストは差異をより良く可視化するために調整されたことに注意する。)
我々はovershadowingやstaircase artifactsのようなアーティファクトを回避することを決めた。これは、それらの存在が結果として前述のテストにおいてアーティファクトフリーな画像に対する明らかな優先傾向となるためである(図3を参照)。用いられるアルゴリズムは以下である。
(図3:アーティファクトあり(a)となし(b)のシーンにおいてアルゴリズムを選択する確率。アーティファクトがない場合には著しく異なる結果を引き起した。拡大された画像のコントラストは差異をより良く可視化するために調整されたことに注意する。)
Percentage-Closer Filtering (PF)。PFは二値のシャドウマップテストの結果をフィルタリングすることによるハードシャドウの境界に対するアンチエイリアシング手法として導入された[Reeves et al. 1987Reeves, W. T., Salesin, D. H. and Cook, R. L. 1987. Rendering antialiased shadows with depth maps. Proceedings of the 14th annual conference on computer graphics and interactive techniques 283–291. 10.1145/37401.37435. https://doi.org/10.1145/37401.37435.]。しかし、これは適切なフィルタカーネルの大きさを設定することによってソフトシャドウの半影領域をシミュレートするためにも用いることができる。しかし、カーネルの大きさは大局的なパラメータであり、局所的な半影の大きさを変化させられないので、その手法は図2aに示されるようにpenumbra softeningを再現できない。これは安価な非物理的アルゴリズムであり、我々が期待するのは、それが研究において最も物理的にもっともらしくないものとして現れるであろう、ということである。
Percentage-Closer Soft Shadows (PS)。PS[Fernando 2005Fernando, R. 2005. Percentage-closer soft shadows. ACM SIGGRAPH 2005 sketches 35–es. 10.1145/1187112.1187153. https://developer.download.nvidia.com/shaderlibrary/docs/shadow_PCSS.pdf.]は、半影の大きさが光源からレシーバーおよびブロッカージオメトリまでの相対距離に基づいてフラグメントごとに動的に計算される、というPFの拡張である。これは光源からのブロッカージオメトリまでの距離を近似するために単一のシャドウマップを用い、それ故に、単サンプルのソフトシャドウアルゴリズムとして知られている。この単純な経験則的モデルは半影の大きさの変化を計算に入れるが、そのアルゴリズムの非物理的性質はsoftness overlapの異なる度合いを持つ半影の領域において問題を引き起こす(図2b)。最近の手法は時間的一貫性を伴うPSを組み合わせることによってより高品質を達成する[Schwärzler et al. 2013Schwärzler, M., Luksch, C., Scherzer, D. and Wimmer, M. 2013. Fast percentage closer soft shadows using temporal coherence. Proceedings of the ACM SIGGRAPH symposium on interactive 3D graphics and games 79–86. 10.1145/2448196.2448209. https://www.cg.tuwien.ac.at/research/publications/2013/SCHWAERZLER-2013-FPCSS/SCHWAERZLER-2013-FPCSS-draft.pdf.]。ただし、これは一貫性が破綻しない場合に限ってのみ完璧に機能する。
Backprojection (BP)。Backprojection[Atty et al. 2006Atty, L., Holzschuch, N., Lapierre, M., Hasenfratz, J.-M., Hansen, C. and Sillion, F. X. 2006. Soft shadow maps: Efficient sampling of light source visibility. Computer Graphics Forum 25, 4, 725–741. 10.1111/j.1467-8659.2006.00995.x. https://inria.hal.science/inria-00281374/PDF/bitmapSoftShadows05.pdf.]はシャドウマップから小さなブロッカーパッチを識別し、それらを光源に逆投影することによってそのシーンにおけるある点に届く光の量を推定する。この手法は可視性が単一のサンプルを用いてのみ推定されるという事を除いて物理ベースである。そのアルゴリズムはより単純なPS手法よりも正確に複合的なpenumbra overlapと半影の大きさの変化の両方を扱うことができる。残念ながら、BPはライトリークとovershadowingアーティファクト(すなわち、半影が若干暗くなりすぎる可能性がある)を起こす傾向がある。我々は、overshadowingアーティファクトを引き起こさないためでもある、慎重に選択されたパラメータでライトリークを減らすために、gap-fillingアプローチ[Guennebaud et al. 2006Guennebaud, G., Barthe, L.̈c and Paulin, M. 2006. Real-time soft shadow mapping by backprojection. Proceedings of the 17th eurographics conference on rendering techniques 227–234. https://www.irit.fr/recherches/VORTEX/publications/rendu-geometrie/EGSR2006_Guennebaud_et_al.pdf.]を用いることを選んだ。
BPをより堅牢にすることを目標に持ついくつかの手法がそれ以来発表されてきたが、通常は単サンプルのアーティファクトを緩和していることに注意する。しかし、これらすべては複数のシャドウマップレイヤ[Schwarz and Stamminger 2008Schwarz, M. and Stamminger, M. 2008. Microquad soft shadow mapping revisited. Eurographics 2008 - short papers. 10.2312/egs.20081034. https://michael-schwarz.com/research/publ/files/microquads-eg08.pdf.; Bavoil et al. 2008Bavoil, L., Callahan, S. P. and Silva, C. T. 2008. Robust Soft Shadow Mapping with Backprojection and Depth Peeling. Journal of Graphics Tools 13, 1, 19–30. 10.1080/2151237X.2008.10129254. https://www.sci.utah.edu/~stevec/papers/jgt08.pdf.]、または、複数視点からのシャドウマップサンプル[Yang et al. 2009Yang, B., Feng, J., Guennebaud, G. and Liu, X. 2009. Packet-based hierarchal soft shadow mapping. Computer Graphics Forum 28, 4, 1121–1130. 10.1111/j.1467-8659.2009.01489.x. https://inria.hal.science/inria-00390541/PDF/Packet-based_Hierarchal_Soft_Shadow_Mapping.pdf.]における複合的な可視性計算のコストを伴い、改善された正確性に対するリアルタイム要件を本質的に緩和させる。
Ground Truth (GT)。我々は参考解として、範囲光源を複数回サンプルし、その後、結果のシャドウマップと一緒にブレンドする、ブルートフォース手法を用いる。この手法は十分な数のポイントライトに対して物理的なground truthに収束するので(大域照明効果を無視して)、我々はこれをこの研究の範囲内でground-truth解と呼ぶ。我々の実験において、その解は1024サンプル以降に収束した(すなわち、それ以上のピクセル強度の変化がなかった)。このアプローチは低速であるが、overlappingアーティファクトなしに正しいpenumbra softeningを生成する。
これらの手法のそれぞれが達成できる近似品質は根本的に異なり、PFからGTの順に増加する。PFは均一な半影をモデル化することだけが可能であるが、PSは局所的な半影の大きさの変化に対する能力を持つ。BPは、光源の遮蔽率の積分の正確な物理モデルを用いるので、物理ベースの半影を計算することによってさらに一歩先を行く。GTは1024サンプルが用いられるときに現実解に収束するという意味において 物理的に正しい 半影を計算する。アルゴリズムの能力のまとめに関しては表1を参照のこと。
: 表1:この研究において調査されるアルゴリズムによってサポートされるソフトシャドウ近似に対する能力。
| 半影の大きさの変化 | 物理ベースの半影 | 物理的に正確な半影 | |
|---|---|---|---|
| PF | - | - | - |
| PS | - | - | |
| BP | - | ||
| GT |
5. シャドウ知覚の独立変数(INDEPENDENT VARIABLES OF SHADOW PERCEPTION)#
ソフトシャドウの知覚は、観測者およびオブジェクトの移動、テクスチャの色、ライトの角度、ライトの数、シーンの複雑さのような多くの要因の影響を受ける可能性がある。この研究において、我々は、ライトとオブジェクトの空間的関係と結果の半影のカテゴリ、および、ユーザ体験の度合い、の2つの要因に焦点を当てる。我々はテストシーンの有意義なセットでこれらの要因を評価する。
5.1. 半影のカテゴリ(Penumbra Categories)#
我々はソフトシャドウアルゴリズム間の品質差を引き起こすソフトシャドウの2つの特性を識別した。1つ目は複数のシャドウキャスタの場合でのpenumbra overlapsであり、これは経験的モデルを用いて誤魔化すのが難しい複合的なシャドウイング効果を引き起こし得る(例えば、正しいオクルーダの融合)。2つ目はpenumbra softeningであり、シャドウキャスタの点とシャドウレシーバにある対応する点との間の距離がシャドウをキャストしている表面に沿った十分な変化を持つときに発生する(例えば、図2における薄いオクルーダの上と下の点を考える)。図2はこれら2つの特性に関して、使用したシャドウアルゴリズムすべての間の見た目の差異がある状況を示している。両方の現象はシーン中にあったりなかったりするので、結果として半影カテゴリとして示される4つの取り得る組み合わせとなる。これらの効果がいずれもない場合、ソフトシャドウアルゴリズムは基本的に区別できない。
5.2. ユーザ体験(User Experience)#
この研究のもうひとつの目標は異なるユーザ体験レベルでのソフトシャドウ近似の知覚を評価することである。我々は3つの経験レベルを評価する複数のフェーズを設計することによって被験者が研究中に得る知識を使うことを選択した。この設計は典型的なユーザの学習の振る舞いを研究することができるという追加の利点を持つ。具体的には、各ユーザは3つの連続するフェーズに参加する。第1フェーズでは、我々は未経験者から期待されるソフトシャドウ近似を区別する能力を、第2フェーズでは、熟達者から期待される最大限の能力を、第3フェーズでは、経験者のパフォーマンスを計測する。これらのフェーズは節6においてその詳細が説明される。加えて、我々は同一条件下で同じ実験を行ったソフトシャドウの専門家のグループを含めた。
5.3. シーンカテゴリ(Scene Categories)#
有意義な結果を生み出すため、我々は選ばれたシーンのセットにおいて様々なオブジェクトおよびシャドウの複雑さを含める必要がある。具体的に、我々は多種多様な取り得るシーン構成を含めるために 系統的 であることを我々の研究に欲している。しかし、シーン中のオブジェクト数、それら個々の複雑さ、それらの配置のようなシャドウ知覚に影響を与え得る多くの要因がある。その課題は、すべての要因の組み合わせを調査するときの次元の呪いを回避しつつ、実践で遭遇する最も可能性のあるシーン構成を系統的に含める小さなカテゴリのセットを見つけることであった。選択されるシーンカテゴリは以下である。
Simple Objects。シーンは箱や円柱のような単純な普通のオブジェクトで構成される。これは、ユーザが最終的なシャドウ形状についての最も強い理解を持つはずであるので、重要な極限のケースである。ほとんどの複合的なオブジェクトはこれらの基本的な構成要素から構築できる。アプリケーションでは、そのようなオブジェクトは、例えば、屋根のない家や都市環境における柱を表現するのに使われる。
Complex Objects。複合的オブジェクトはより複合的な配置を形成する最初のカテゴリからのオブジェクトの集まりであり、あまり多くの規則性を示さない。
Structured Objects。構造的オブジェクトは、1または2次元における並進対称性のような[Pauly et al. 2008Pauly, M., Mitra, N. J., Wallner, J., Pottmann, H. and Guibas, L. J. 2008. Discovering structural regularity in 3D geometry. ACM Trans. Graph. 27, 3, 1–11. 10.1145/1360612.1360642. https://www.geometrie.tugraz.at/wallner/structure.pdf.]、高いレベルの規則性と対称性を示す。例えば、フェンスは1次元において箱が規則的に配置されたものとして、フェンスの横木はその垂直な次元において箱が規則的に整列したものとして示すことができる。これを別のカテゴリとして持つことは、人間がシャドウにおいても構造を識別するであろうことから、必要不可欠である。加えて、規則的な部分はそれらのシャドウが別の存在に属するものとして知覚されないように繋がっていなければならない。
Vegetation。Vegetationは葉っぱのようなより小さなオブジェクトの不規則で一見すると無作為な配置を示す。ここでは、葉っぱの密度のような統計的な特性は個々のプリミティブより重要となる。我々は、観測者がシャドウとシャドウキャスタを比較するのに使える規則性の最小量のために別の極端なケースを構成するので、別個のカテゴリとしてこれを選んだ。また、それは、高度に複合的な輪郭により、ソフトシャドウ近似に対する困難なケースを構成する。
被験者に実際に提示する構成へと至るために、我々はシーンと半影カテゴリを単純に組み合わせると16つの異なる組み合わせが得られるであろうことに着目する。しかし、いくつかの特例がある。フェンス、格子、植木では、penumbra overlapは、そのようなオブジェクトの個々の部分が繋がっていなければならないので、常に発生するだろう。一般的に、これは木々のような無作為なオブジェクトに対しても真であり、取り得る組み合わせを12に減らす。最終的に、より少ない人工的な設定も調査するため、我々は、平らでない表面に部分的にキャストされるsofteningおよびoverlappingする半影を伴う、もうひとつのカテゴリ(ゲームシーン)を追加し、結果として合計13つの組み合わせとした。我々は2つの異なるシーンによってこれらの組み合わせのそれぞれを表現し、全体で26つのテストシーンに至る。図4はこれらのシーンの選択を示し、半影(行)とシーンカテゴリ(列)によってそれらを分類する。
(図4:この表は調査される半影とシーンカテゴリの組み合わせを示す。行は半影カテゴリを示し、色はシーンカテゴリを示す。空欄はもうひとつの方によって説明されるカテゴリを示す(詳細は節5.3を参照)。)
その他のシーン特徴。追加のサンプリング次元を導入できなかった変数ごとに、我々は、ほとんどの場合で”ワーストケース”となる条件、すなわち、ユーザがソフトシャドウの不正確さに最も敏感となる所の条件に対応する構成を用いることを決定した。ここでは、静的なビュー条件を用いることで徹底的にシャドウを調査する能力を最大化する。シャドウを受けるジオメトリとしての平坦な白い表面はマスキング効果なしにシャドウ特性の最適な知覚を可能にする。シャドウをキャストするライトに対して白色を用いることはシャドウのコントラストを最大化する。さらに、我々はユーザのこれらのジオメトリの認識を促進するためにシャドウをキャストするオブジェクトの可塑性を増加させた。これは商用のオフラインレンダラによるアンビエントオクルージョン、および、ピクセル毎に基づくディフューズシェーディングを計算することによって達成された。異なるオブジェクトの区別を強調するため、シャドウをキャストするオブジェクトは原色および二次色 (赤、黄、など)で質感を持たせた。距離の知覚は白色のシャドウを受ける範囲を囲む領域に対してチェッカーボードテクスチャを用いることによって促進させた。心地良いが真面目な空気を生成するため、アンビエント光が有効化され、背景はライトブルーで色付けされた。
6. 実験の手続き(EXPERIMENTAL PROCEDURE)#
我々は大学関連のオンラインフォーラムで公募することによって採用された48人の被験者で実験を行った(平均年齢26.27、標準偏差7.57、女性25人、男性23人)。アーティスト、重度のゲーマー、コンピュータグラフィックスの経歴を持つ人は未経験の被験者を保証するためにこの研究において参加することを一切許可されなかった。加えて、我々はシャドウや大域照明を扱う科学文献の発表経験を1本以上持つ8人の専門家を採用した(平均年齢33.75、標準偏差7.76、全員男性)。人々は2つのグループの内の1つに無作為に割り当てられた(グループA:男性12人、女性13人、専門家4人。グループB:男性12人、女性12人、専門家4人)。合計で、14,976票が投じられた。
その実験は同じ純然な人工的光条件を保証するために窓を閉め切った部屋で行われた。平均で、その実験は非専門家に対して46分、専門家に対して62分かかった(regeneration breaks1を含めず)。十分なレベルの意欲を保証するため、各被験者には報酬が支払われた。その実験は(短いrecreational breaks2を挟んで)3つのフェーズに分けられ、それぞれは合計で91回の試験から成る(図5を参照)。
(図5:我々の実験の3フェーズ設計。第1フェーズでは、ユーザは未経験であり、一対比較の作業を行った。第2フェーズでは、比較用の参考解付きで行い、最後のフェーズでは、再び一対比較を行ったが、2つのグループの内の1つには若干異なる作業が無作為に割り当てられた。)
6.1. 比較作業(Comparison Task)#
被験者は各試験で2つの画像を確認し、シーンの床にキャストされるソフトシャドウを判断することによって比較しなければならないであろうことを指示された。彼らは画像が同一である可能性があること知らされた。彼らはシャドウを生成する光源がその個々の位置で黄色の四角として可視化される範囲光源であることを告げられた。各被験者は明示された順序で3つすべてのフェーズに参加しなければならなかった(図5)。
フェーズ1。このフェーズでは、初期未経験者は参考を含まずに異なるシャドウアルゴリズムでレンダリングされた2つの画像を比較しなければならなかった。被験者はソフトシャドウがより良く見えると考える方の画像を選択するよう頼まれた。我々は、この方が未経験者にとって”物理的によりもっともらしい”ソフトシャドウを選択するよう頼むより直観的であると事前調査で気づいたので、この質問を選択した。
フェーズ2。第2フェーズでは、比較される画像のペアの上部に参考画像が示された。被験者はこれが物理的に正しいシミュレーションであることを告げられた。そして、彼らはその参考の下にある2つの画像のどちらが物理的によりもっともらしいソフトシャドウを持つかを判断するよう頼まれた。
フェーズ3。最終フェーズでは、比較作業が参考なしで再び行われた。被験者は、両群全体で均等に分けられた男女を持つ、2つのグループに分けられた。グループAはフェーズ1におけるものと同じ質問を受け(どちらのシャドウがよく見えるか)、グループBはフェーズ2におけるものと同じ質問を受けた(どちらのシャドウが物理的によりもっともらしいか)。
回答はスライダーで与えられた。ここでは、被験者らはペアの左または右の画像に対する優先傾向の度合いを点数化できた。スライダーは連続的な尺度を持った。左および右の端には、対応する画像に対する明らかな優先傾向を定義するようにラベルが置かれた。両画像の間に位置するスライダーの中心には、優先傾向なしのマークがあった。
2AFC設計に対する決定は2つのアルゴリズムの結果の間の実際の知覚可能な差異が小さかった場合に対する我々の懸念によって動機付けされた。これらの場合、中立的な選択肢は、結果の一貫性を低下させる矛盾する回答を引き起こす調査対象外の要因(例えば、鋭いエッジに対する一般的な優先傾向)に基づく強制的な決定を回避する。さらに、中立的な回答を数えることは特定のシーンカテゴリおいて比較されるアルゴリズムの品質での知覚される類似性に対する基準をもたらす(節7を参照)。
連続的な回答尺度は中立的またはほぼ中立的な回答が支配的になる問題を減らすために順序的なものの代わりに選ばれたことに注意する。その連続的尺度は被験者に優先傾向の大きさを指定することと錯覚させるはずであるのに対して、そのデータは最終的に順序尺度で解析された(“left preferred”、“no preference”、“right preferred”)。
比較には時間制限はなかった。次の試験は前のものの回答の後に開始され、2秒間白い背景に黒いfixation cross3を先行して表示させた。
6.2. 画像ペア(Image Pairs)#
半影とシーンのカテゴリの組み合わせ13つと、4つのソフトシャドウアルゴリズムの取り得るペアリングの組み合わせつは被験者あたり78つの一対比較をもたらす。これに対して、我々は半影とシーンの組み合わせごとに無作為に選ばれたアルゴリズムでレンダリングされた同一の画像のペアを1つ追加し、合計91つの画像ペアをもたらす。同一の画像ペアは被験者の回答の基準値と同一画像ペア条件に対する一致性を得るために使われた。
それぞれの半影とシーンの組み合わせにおける最小の種類を得るため、我々は13つの組み合わせのそれぞれに対して2つのシーンを生成した。これは、異なる配置または異なるモデルによって得られた。実験で使われるすべての画像は4つのソフトシャドウアルゴリズムを伴う各シーンをレンダリングすることによってオフラインで生成された。4つすべての手法は32ビットの浮動小数点精度を持つピクセルのシャドウマップを活用した。光源の色および強度やアンビエント項のようないくつかの構成はすべてのレンダリング手法で等しいままであった。ほかのレンダリングパラメータはレンダリング画像ができる限りground truthに似るように調整された。
時間に関連する効果を相殺するため、すべての被験者はすべてのフェーズを通して個別に無作為化された順序で画像ペアを見た。各比較ペアの画像は左か右の位置に無作為に割り当てられた。フェーズ1では、被験者はカテゴリごとに我々が作成した2つのシーンの内の1つを見、フェーズ2では、残り一方を見た。どのフェーズでシーンのどちらが選択されたかもまたカテゴリや被験者ごとに無作為に決定された。フェーズ3では、画像ペアはカテゴリの両方のシーンに対して、被験者が第1フェーズでのシーンの50%と第2フェーズでのシーンの50%をそれぞれ見るように、無作為に選び取られた。
7. 解析の方法論(ANALYSIS METHODOLOGY)#
(訳注:略)
8. 結果(RESULTS)#
(訳注:略)
9. まとめと結論(SUMMARY AND CONCLUSIONS)#
この研究では、我々は非専門的ユーザがソフトシャドウをどのように知覚するか、および、この現象のシミュレーションにおいてどの程度まで簡略化に敏感であるかを調査した。我々は4つの異なるソフトシャドウシミュレーション手法のセットでの一対比較の手法を用いてユーザの優先傾向を研究することによってこれを行った。その手法は4つの別個の品質レベルを表すように選択された。
ソフトシャドウは大局的なライティング現象であるので、優先傾向の投票にはユーザに光源、シャドウキャスタ、シャドウレシーバの相互作用を解析させる必要がある。我々はソフトシャドウの理解が通常のユーザに学習させられる能力であることを期待し、それ故に、ユーザ体験の3つのコーナーケースを構成するためにこの研究では3つのフェーズを用いた。加えて、我々はこの研究に専門家を含め、彼らの結果を非専門家と比較した。
この研究の結果から得られた我々の主な結論は以下である。
未経験者は正しいソフトシャドウを優先する直観を持つ。被験者間の合意が低いにも関わらず、驚くことにその結果は物理的に正しいモデルに対する大幅な優先傾向へ収束する。
ユーザは物理ベースのソフトシャドウの特徴を理解するために学習できる。未経験者とは反対に、経験者や熟達者は局所的に変化する半影を生成できるアルゴリズムをこの能力のないアルゴリズムより優先し、似ていないpenumbrae overlapのときはフェイクのソフトシャドウよりも物理ベースの解法を優先する。
“どれがより良く見えるか”と尋ねるとより重要な結果をもたらす。我々は、非専門家と専門家の両方に対してより重要で有意義な結果を得たので、どのシャドウが物理的によりもっともらしいか(グループB)よりもどのシャドウがより良く見えるか(グループA)と尋ねる方が有益であることを発見した。
ゲームデザイナーに対する教訓。BPのアーティファクト抑制は多くの細かい調整の努力と実装時間を必要とするので、PSのようなより単純な手法は、ゲームに高い現実感を求めない場合には、良い妥協案となるかもしれない。一方の注目度の高いゲームでは、経験者がBPのような物理ベースのシャドウを好むであろうことから、シャドウ計算により多くのリソースを投入すると成功するかもしれない。
研究者に対する教訓。GTに対する驚くほど明らかな優先傾向は堅牢性や効率性に加えて正確性の観点において最良のリアルタイム手法をさらに改善するための実践的なポテンシャルがあることを示唆している。これは 、ただ何気なく ソフトシャドウ近似に遭遇する未経験者の利益にさえもなる。
10. 今後の課題(FUTURE WORK)#
(訳注:略)