オープンソースかつ高品質な日本語データセットの作成およびその効果の実証