The world today is increasingly visual. Many of the most popular online social networking services are largely powered by images, making image privacy protection a critical research topic in the fields of ubiquitous computing, usable security, and human-computer interaction (HCI). One topical issue is understanding privacy-threatening content in images that are shared online. This dataset article introduces DIPA2, an open-sourced image dataset that offers object-level annotations with high-level reasoning properties to show perceptions of privacy among different cultures. DIPA2 provides 5,897 annotations describing perceived privacy risks of 3,347 objects in 1,304 images. The annotations contain the type of the object and four additional privacy metrics: 1) information type indicating what kind of information may leak if the image containing the object is shared, 2) a 7-point Likert item estimating the perceived severity of privacy leakages, and 3) intended recipient scopes when annotators assume they are either image owners or allowing others to repost the image. Our dataset contains unique data from two cultures: We recruited annotators from both Japan and the U.K. to demonstrate the impact of culture on object-level privacy perceptions. In this paper, we first illustrate how we designed and performed the construction of DIPA2, along with data analysis of the collected annotations. Second, we provide two machine-learning baselines to demonstrate how DIPA2 challenges the current image privacy recognition task. DIPA2 facilitates various types of research on image privacy, including machine learning methods inferring privacy threats in complex scenarios, quantitative analysis of cultural influences on privacy preferences, understanding of image sharing behaviors, and promotion of cyber hygiene for general user populations.

最も人気のあるオンラインソーシャルネットワーキングサービスの多くは,画像によって大きく支えられており,画像のプライバシー保護はユビキタスコンピューティングやユーザブルセキュリティ,HCIにおける重要な研究トピックとなっています.本研究は,異なる文化間のプライバシーに対する認識を示すために,高度な推論特性を持つオブジェクトレベルの注釈を提供するオープンソースの画像データセットであるDIPA2を提案します.DIPA2は,1,304枚の画像内の3,347オブジェクトの認識されたプライバシーリスクを記述する5,897の注釈を提供します。注釈にはオブジェクトのタイプと,さらに4つのプライバシー指標が含まれています.1) 画像が共有された場合にどのような情報が漏洩する可能性があるかを示す情報の種類,2) プライバシー漏洩時に予想される深刻度,3) アノテーション付加者が画像の所有者,あるいは他人に画像を再投稿させることを許可していると仮定した場合の意図された受信者の範囲.さらに,本データセットには,物体レベルのプライバシー認識に対する文化の影響を示すために,日本とイギリスの両方からアノテーション付加者を募集し,データを収集しました.DIPA2は,複雑なシナリオでのプライバシー脅威を推測する機械学習手法,プライバシー嗜好に対する文化的影響の定量的分析,画像共有行動の理解,および一般的なユーザー集団のサイバーハイジーンの促進など,画像プライバシーに関するさまざまなタイプの研究を容易にすること期待されます.

The DIPA dataset is available here. DIPAデータセットは以下より利用可能です.


Anran Xu, Zhongyi Zhou, Kakeru Miyazaki, Ryo Yoshikawa, Simo Hosio, and Koji Yatani. 2024. DIPA2: An Image Dataset with Cross-cultural Privacy Perception Annotations. Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 7, 4, Article 192 (December 2023), 30 pages. (paper)

Anran Xu, Zhongyi Zhou, Kakeru Miyazaki, Ryo Yoshikawa, Simo Hosio, and Koji Yatani. 2023. DIPA : An Image Dataset with Cross-cultural Privacy Concern Annotations. In Companion Proceedings of the 28th International Conference on Intelligent User Interfaces (IUI ’23 Companion). Association for Computing Machinery, New York, NY, USA, 259–266. (paper)