

星野, 伸明
出版情報: 日本統計学会誌. シリーズJ = Journal of the Japan Statistical Society. Japanese issue.  40  pp.23-45,  2010-09-01.  日本統計学会 = Japan Statistical Society
URL: http://hdl.handle.net/2297/32268
概要: 公的統計のミクロデータ利用を促進する上で大きな課題を二点挙げると,一点目は利用目的制限の緩和,二点目は利用可能な統計調査の拡大である.本稿ではこれらの課題の解決策を検討する.前者については,一般目的汎用ファイルの提供が望ましい.これを実現す るには,絶対的な匿名性を持ち有用なデータの作成を目標とするべきである.後者については,事業所・企業調査など匿名化が難しいデータも提供するのが望ましい.匿名化が困難な場合について先進的事例を調査したところ,原データの統計的性質を一部保存するデータの作成が目標となっている.そのようなデータを確率的に生成するのが模造(synthesis)という概念であり,一般目的汎用ファイルの作成でも有用である.従って本稿では,模造手法も整理して紹介する. Among the most important issues on promoting the secondary analysis of Japanese official microdata, the author would like to focus upon two expansions: One is to expand purposes allowed to use microdata, and the other is to expand the variety of statistics allowed to be used. The former should be attained by producing public use files that are absolutely anonymous, while the utility of data is preserved. The latter requires to anonymize easily-identifiable statistics. These two goals seem to entail the same methodology known as synthesis. Terefore the present article reviews researches and practices on disseminating synthetic data. 続きを見る


Hoshino, Nobuaki ; Takemura, Akimichi ; 星野, 伸明
出版情報: Journal of the Japan Statistical Society.  28  pp.125-134,  1988-12-01.  日本統計学会 = Japan Statistical Society
URL: http://hdl.handle.net/2297/12412
概要: 金沢大学人間社会研究域経済学経営学系<br />Fisher's logarithmic series model (Fisher et al. (1943)) is a classical model in statistical eco logy. In this paper we show that this model is a key model linking three models discussed in Takemura (1997), i.e., Poisson-gamma model (Bethlehem et al. (1990)), Dirichlet-multinomial model (Takemura (1997)), and Ewens model (Ewens (1990), Sibuya (1993)). This connection opens up the possibility of applying existing techniques of statistical ecology to the problem of microdata disclosure risk assessment. 続きを見る


Hoshino, Nobuaki ; 星野, 伸明
出版情報: 日本統計学会誌.  33  pp.105-117,  2003-06-01.  日本統計学会
URL: http://hdl.handle.net/2297/12411
概要: 金沢大学人間社会研究域経済学経営学系<br />The present article describes a Conditional Inverse Gaussian-Poisson (CIGP) distribution, obtain ed by conditioning an inverse Gaussian-Poisson population model on its total frequency. This CIGP distribution is equivalent to random partitioning of positive integers, with the possibility for a number of applications in statistical ecology, linguistics and statistical disclosure control to name a few. After showing the marginal moments of the distribution, parameter estimation is discussed. Fitting the CIGP distribution to some typical data sets demonstrates its applicability. 続きを見る


Hoshino, Nobuaki ; 星野, 伸明
出版情報: Annals of the Institute of Statistical Mathematics.  64  pp.457-474,  2012-06-01.  Springer Verlag (Germany) / Annals of the Institute of Statistical Mathematics ; AISM = 統計数理研究所
URL: http://hdl.handle.net/2297/30340
概要: The present article investigates a class of random partitioning distributions of a positive integer. This class is calle d the limiting conditional compound poisson (LCCP) distribution and characterized by the law of small numbers. Accordingly the LCCP distribution explains the limiting behavior of counts on a sparse contingency table by the frequencies of frequencies. The LCCP distribution is constructed via some combinations of conditioning and limiting, and this view reveals that the LCCP distribution is a subclass of several known classes that depend on a Bell polynomial. It follows that the limiting behavior of a Bell polynomial provides new asymptotics for a sparse contingency table. Also the Neyman Type A distribution and the Thomas distribution are revisited as the basis of the sparsity. © 2011 The Institute of Statistical Mathematics, Tokyo. 続きを見る


星野, 伸明
出版情報: 地域経済ニューズレター.  49  pp.6-7,  1999-07-31.  金沢大学経済学部地域経済資料室
URL: http://hdl.handle.net/2297/1973
概要: 金沢大学経済学部・講師


星野, 伸明 ; Hoshino, Nobuaki
出版情報: 平成28(2016)年度 科学研究費補助金 基盤研究(C) 研究成果報告書 = 2016 Fiscal Year Final Research Report.  2014-04-01 - 2017-03-31  pp.4p.-,  2017-04-11. 
URL: http://hdl.handle.net/2297/00051917
概要: 金沢大学人間社会研究域経済学経営学系<br />個体情報が保護されていることの法的定義は、個体識別が出来ない状態である。しかしこの定義は技術的に曖昧なので、個票データは過剰に匿名化されたりする。このような社会的損失を正すには、個体識別可能性 を明確化しなければならない。本研究は個体識別ができない状態を統計的推定の対象として明確化することを目的とし、細部まで詰めた理論を構築した。また本研究はこの理論を実証するため、既公開の匿名データが個体識別可能性の情報を持っていることに着目し、平成15年の住宅・土地統計調査匿名データの個体識別可能性を計測した。<br />The information protection of an individual is legally defined as unidentifiability. However, this definition is technically vague, and it often leads to the overanonymization of microdata. To mitigate this social loss, we need a clear technical definition of identifiability. Our study aims to clarify this unidentifiability as an object of statistical estimation, and has constructed the detailed theory of this idea. Also our study notes that the exting Anonymized Data have the information of unidentifiability of the data, and thus has measured the possibility of identification on these data of Housing and Land Survey of 2003.<br />研究課題/領域番号:26380269, 研究期間(年度):2014-04-01 - 2017-03-31 続きを見る


星野, 伸明 ; Hoshino, Nobuaki
出版情報: 平成25(2013)年度 科学研究費補助金 基盤研究(C) 研究成果報告書 = 2013 Fiscal Year Final Research Report.  2011-2013  pp.5p.-,  2014-04-21.  金沢大学人間社会研究域経済学経営学系
URL: http://hdl.handle.net/2297/00051918
概要: 本研究課題の期間中に、攪乱・模造データの個票開示リスク評価について部分的な解を得ることができた。特に受容可能な個票開示リスクの客観的な判定方法の提案が重要な結果と思われる。これにより、匿名化の社会的利用に関するボトルネックが軽減できる。また 確率分割の周辺分布について組み合わせ論的評価にも成功し、個票開示リスク測度の厳密な算出に貢献出来た。<br />Throughout the project a partial progress has been estalished on the evaluation of the disclosure risk of perturbed or synthetic microdata. Especially it is important that an objective method has been proposed on the decision of the threshold value of microdata disclosure risk. It is so because the current practice of that decision is so subjective that anonymization techniques are not widely accepted.Another progress of this project has been seen in the evaluation of the marginal distribution of a random partitioning distribution. This result employs combinatorial arguments, which lead to an exact derivation of a measure of microdata disclosure risk.<br />研究課題/領域番号:23530251, 研究期間(年度):2011-2013 続きを見る


星野, 伸明 ; Hoshino, Nobuaki
出版情報: 平成22(2010)年度 科学研究費補助金 若手研究(B) 研究成果報告書 = 2010 Fiscal Year Final Research Report.  2009-2010  pp.4p.-,  2011-04-12.  金沢大学人間社会研究域経済学経営学系
URL: http://hdl.handle.net/2297/00051919
概要: 本研究は実証と理論の両面で進めた。まず実証面では労働力調査個票データを匿名化し、匿名化手法のリスクや有用性を実証研究するための基盤を構築した。また実証の妥当性を確保し、日本の匿名化実務について指針を得るため、外国の先進的事例を調査してまとめ た。理論面では、リスク評価の対象として頻出する疎な分割表の挙動を説明するため、極限条件付き複合ポアソン分布族の性質を評価した。特に、ベル多項式に依存した新しい漸近論を提案した。<br />This project has progressed both on an empirical basis and on a theory. One empirical contribution is an anonymized data set of the Japanese Labor Force Survey, which will be used to test the risk and utility of anonymization methods. Another contribution is a survey on the advanced practices and researches of anonymization. This survey has been especially conducted to provide a sound view on the current Japanese anonymization practices and researches. On a theory, the limiting conditional compound Poisson distribution has been investigated to explain the behavior of a sparse contingency table, which often arises in assessing disclosure risk. In particular, a new asymptotics based on a Bell polynomial has been proposed. 続きを見る


星野, 伸明 ; Hoshino, Nobuaki
出版情報: 平成20(2008)年度 科学研究費補助金 若手研究(B) 研究成果報告書 = 2008 Fiscal Year Final Research Report.  2006-2008  pp.4p.-,  2009-04-16.  金沢大学人間社会研究域経済学経営学系
URL: http://hdl.handle.net/2297/00051920
概要: まず実務的な成果を説明する。研究代表者は、個票開示リスク評価に用いるモデル族の合理的な構成方法を提示した。疑似多項分布はこの族のメンバーであり、特に個票開示リスク評価に必要な結果を与えた。数理的な成果としては、離散多変数分布の族を提案して性 質を評価した。また、確率分割の族を小数法則によって特徴づけした事が重要である。<br />研究課題/領域番号:18730145, 研究期間(年度):2006-2008<br />出典:「疑似多項分布による個票開示リスク評価」研究成果報告書 課題番号18730145(KAKEN:科学研究費助成事業データベース(国立情報学研究所))(https://kaken.nii.ac.jp/report/KAKENHI-PROJECT-18730145/18730145seika/)を加工して作成 続きを見る


星野, 伸明 ; Hoshino, Nobuaki
出版情報: 平成17(2005)年度 科学研究費補助金 若手研究(B) 研究概要 = 2005 Research Project Summary.  2003 – 2005  pp.1p.-,  2016-04-21. 
URL: http://hdl.handle.net/2297/00061099
概要: 金沢大学人間社会研究域経済学経営学系<br />本年度は計画の最終年度なので、成果発表に補助金を用いた。主な使途は、国際統計協会(ISI)の第55回大会での口頭発表(海外)である。口頭発表に重点を置いたので特に記すと、他に国内学会発表2件( 応用統計学会、統計関連学会連合大会)、講演2件(応用統計ワークショップ(東京大学経済学部)、研究集会(東京大学工学部))で研究成果を述べた。加えて、下記のような理論的考察を行った。各セルの度数が独立に複合ポアソン分布に従うとして、その総和を所与としたセル度数の条件付き同時分布を「条件付き複合ポアソン分布」と呼ぶ事にする。この分布は複合ポアソン分布のレヴィ測度(クラスター分布)を変えることで様々な種類が得られ、分布族をなす。そしてクラスター分布が一点分布に退化した場合に、条件付き複合ポアソン分布は多項分布になる。つまりこの分布族は多項分布に自然に拡張し、その望ましい性質を一部受け継ぐ。条件付き複合ポアソン分布の中でも解析的に扱い易い例が、多変量負の超幾何分布であり、擬似多項分布である。条件付き複合ポアソン分布を考える最大の利点は、度数の分散を大きく出来る事であり、過分散の記述に適する。またセル確率に相当する母数が全て等しい対称な場合は、本プロジェクトの主要成果である小数法則が適用可能となる。すなわち、極限分布として度数ゼロのセル数に依存しない便利なモデルが現れる。この極限分布は正の整数の確率分割を与えており、クラスター分布がべき級数分布の時、重み付きベル多項式の展開とみなせる。このように考えると、本プロジェクトの確率分割生成方法は、ギブス分割を生成する事が分かる。またコルチンモデルの特殊ケースで、取り扱いが容易な場合となっている。<br />研究課題/領域番号:15730102, 研究期間(年度):2003 – 2005<br />出典:「個票開示リスク評価用超母集団モデルの開発」研究成果報告書 課題番号15730102(KAKEN:科学研究費助成事業データベース(国立情報学研究所))(https://kaken.nii.ac.jp/ja/grant/KAKENHI-PROJECT-15730102/)を加工して作成 続きを見る