はてなキーワード: 品質評価とは
とても鋭い問いだね。最近のAI翻訳が「人間よりうまいのでは?」と感じる瞬間があるのは確かで、特に英語・フランス語・スペイン語など印欧語族同士ではその傾向が強い。だけど、実際のところはもう少し複雑で、完全に「人間より遥かに上」とは言い切れない。
🌍 印欧語族同士の翻訳はAIが“ほぼ人間級”になっているのか?
これは「人間が良いと判断する翻訳をAIも良いと判断しやすい」という意味で、
また、英語・スペイン語・フランス語などのデータが豊富な言語ペアでは、
AIはここでまだ安定しない。
翻訳は単なる置き換えではなく、
AIはここで時々ズレる。
🔹 3. とはいえ、特定条件では“人間より上”のケースもある
「直訳的な誤り」は人間より少ないことすらある。
🔹 4. 結論:印欧語族同士では“人間級”、でも万能ではない
# 生成AIをはてな記法で出力させるためのプロンプト設計に関する研究
生成AIの普及に伴い、特定のマークアップ言語や記法に準拠した出力を生成する需要が高まっています。特に、はてなブログなどで使用されるはてな記法は独自の構文規則を持つため、適切なプロンプト設計が求められます。本報告では、生成AIにはてな記法での出力を指示する際の効果的なプロンプト作成手法について、現行のプロンプトエンジニアリング理論と実践例を基に体系的に分析します。
はてな記法は、見出しやリスト、リンクなどの文書要素を表現するために特殊な記号を使用する軽量マークアップ言語です[1][3]。主要な構文要素としては、アスタリスクによる見出し指定(*見出し*)、ハイフンを用いたリスト作成(- 項目)、角括弧を使ったリンク記述([タイトル:リンク先URL])などが挙げられます。これらの構文規則を生成AIに正確に理解させるためには、プロンプト設計において以下の課題が存在します。
第一に、記法の曖昧性排除が挙げられます。はてな記法では特定の記号の組み合わせが特殊な意味を持つため、自然言語処理モデルが意図せず他の記号解釈を行うリスクがあります[2][3]。例えば、アスタリスクは強調表現にも使用されるため、文脈に応じた適切な解釈が必要です。
第二に、構文の階層構造の正確な再現が課題となります。はてな記法では入れ子構造のリストや複合的な見出しレベルを表現する際に、特定の記号の組み合わせが必要です。生成AIにこれらの複雑な構造を理解させるためには、プロンプト内で明示的な指示と具体例の提示が不可欠です[1][4]。
第三に、プラットフォーム固有の拡張構文への対応が求められます。はてな記法は基本構文に加え、独自の表記法やマクロ機能を備えており、これらの特殊機能を適切に活用するためには追加的な指示が必要となります[3][4]。
生成AIに期待する出力形式を確実に得るためには、プロンプトの冒頭で役割を明確に定義することが重要です[3][4]。具体的には、「あなたははてな記法の専門家です」といった役割指定を行うことで、AIの応答生成プロセスに方向性を与えます。この役割定義により、モデルは内部に保持するはてな記法関連の知識を優先的に活性化させることが可能となります[1][2]。
```
あなたははてなブログの編集者です。専門的なはてな記法を用いて、正確かつ読みやすい形式でコンテンツを出力してください。
```
### 構文規則の明示的指示
はてな記法の各要素に対応する具体的な構文規則を、箇条書きではなく自然文で列挙します[2][3]。特に重要な点は、記号の使用法と要素間の階層関係を明確にすることです。例えば、見出しレベルと対応するアスタリスクの数、リストの入れ子構造の表現方法などを具体的に指示します[1][4]。
構文指示の例:
```
```
テキスト生成AIは具体例からの類推学習に優れているため、期待する出力形式のサンプルを提示することが有効です[2][3]。特に、複雑な構造を含む場合は、実際の記法例とそれに対応するレンダリング結果を併記することで、AIの理解を促進します。
```
- サブ項目
[詳細はこちら:https://example.com]
```
### 制約条件の明文化
生成結果の品質を保証するため、文字数制限やコンテンツの構成に関する要件を明確に指定します[3][4]。これにより、AIは形式面だけでなく内容面でも適切な出力を生成できるようになります。
制約条件の例:
```
出力は以下の条件を満たすこと:
```
近年提案されているシンボルプロンプト技法を応用し、記号を用いて出力構造を明示的に指示する方法が有効です[1][3]。この手法では、矢印(→)や等号(=)などの記号で要素間の関係性を表現することで、AIの構造理解を促進します。
構造化指示の例:
```
→ セクション1 + セクション2 + セクション3
各セクション → サブ項目 ×3
```
複雑な文書生成では、生成プロセスを複数の段階に分割して指示することで精度を向上させます[3][4]。最初にアウトラインを生成させ、その後各セクションを詳細化する手法が効果的です。
段階的指示の例:
```
4. 関連リンクを適宜挿入
```
可変要素を含むテンプレートを使用することで、汎用的なプロンプトを作成できます[2][3]。角括弧で囲った変数名を使用し、実際の生成時に具体値を入力する方式です。
テンプレート例:
```
```
初期プロンプトの出力結果を分析し、不足している要素や誤った記法を特定します[3][4]。このフィードバックを基に、プロンプトの指示文を段階的に改良していく手法が効果的です。特に、誤りが発生した箇所を具体的に指摘し、正しい記法例を追加することが重要です。
改良例:
```
(修正前)
見出しは*で囲んでください
(修正後)
見出しは*1個で囲み、大見出しは*、中見出しは**を使用してください。例:
```
テキスト指示に加え、サンプル画像やスクリーンショットを併用することで、AIの理解精度を向上させます[2][4]。ただし、現在の技術水準ではテキストベースの指示が主流であるため、補助的な手段として位置付ける必要があります。
温度パラメータ(temperature)やtop_p値などの生成パラメータを調整することで、形式の厳密性と創造性のバランスを最適化します[1][3]。形式重視の場合は低温度設定(0.3-0.5)が推奨されますが、過度に低くすると画一的な出力になるリスクがあります。
### 基本形プロンプト
```
あなたははてなブログの専門編集者です。以下の要件ではてな記法で記事を作成してください:
```
### 高度なプロンプト
```
[役割設定]
あなたはテック分野の専門ライター兼はてな記法エキスパートです。
[タスク]
2024年の生成AI市場動向に関する分析レポートをはてな記法で作成
[構造指示]
各セクション → 3サブ項目 + データ参照
[データソース]
[制約]
```
生成結果がはてな記法の構文規則にどれだけ適合しているかを測定するため、以下の評価項目を設定します[2][4]:
形式面だけでなく、コンテンツの質を評価するための指標として[3][4]:
現在のはてな記法プロンプトはテキストベースが主流ですが、図表や数式を含む複合文書生成への対応が今後の課題です[1][4]。特に、はてな記法の拡張構文であるTeX数式表現やグラフ描画機能を適切に扱えるプロンプト設計手法の開発が求められます。
ユーザーの編集履歴や過去の投稿内容を考慮した文脈依存型プロンプトの開発が必要です[3][4]。これにより、特定のユーザーやテーマに最適化された一貫性のある出力が可能となります。
機械学習を用いたプロンプト自動改良システムの構築が期待されます[2][3]。生成結果の品質評価をフィードバックとして活用し、プロンプトパラメータを自己調整する仕組みの開発により、持続的な品質向上が可能となります。
## 結論
生成AIにはてな記法での出力をさせるためのプロンプト設計は、記法規則の正確な理解と効果的な指示文の構築が鍵となります。本報告で提示した基本原則と高度テクニックを組み合わせることで、形式面・内容面ともに高品質なはてな記法コンテンツの自動生成が可能となります。今後の研究発展により、より複雑な文書構造や動的コンテンツへの対応が進むことが期待されます。プロンプトエンジニアリング技術の進化が、はてなプラットフォームを中心としたコンテンツ作成プロセスの革新を促進するでしょう。
ええ……。Webライターからしたら、雑誌ライターは憧れなんだけど、そんなに稼げないんだね。
私は兼業でWebライターやってるけど、食えてる人は食えてると思うよ。
医療系は単価が高い。フリーランスの看護師ライターとか1文字3円以上。
無名な人でも、Webメディアだけでめちゃくちゃ稼いでるイメージ。
私の知り合いでも看護師の派遣やりながら、看護師ライターをやって月60万以上稼いでたな。
1文字3円って、Web制作会社とかが1文字10円くらいの案件受けて、中抜きしてるからこの相場なんだけどね。
「Webライターは稼げない」はその通りだけど「大企業とお仕事できないWebライターは稼げない」が正確な話だと思うな。
ちなみにAIは、経験のあるWebライターほど気にしてないね。
Webライターの募集ページで「ChatGPTみたいなAIで生成された文章を使ったのが分かったら契約を解除します」といった文言があるくらい。
これはE-E-A-TっていうGoogleの新しい検索品質評価ガイドラインと関係してる。
E-E-A-Tとは「Experience(経験)」「Expertise(専門性)」「Authoritativeness(権威性)」「Trustworthiness(信頼性)」の略。
今SEOはExperience(経験)が重要視されてるんだよね。
昔からワードサラダみたいな自動生成された文章でも検索結果で上位表示できたけど、人間が実際に読んで滞在時間とか短いから、どんどん検索圏外にGoogleは追いやってた。これはAI文章でも変わらないでしょうね。
「AIで自動生成された文章が溢れるのをGoogleは別に良しとはしない」って予測をみんな立ててる。結局、人の手でExperience(経験)をしっかり注入して記事を書く必要あるんだよ。多くのWebメディアの運営者は、AI文章に対してはこういった考え方だね。
AI文章を脅威と言ってる人達は、Webエンジニア界隈の人くらいだと思うな(笑)
https://note.com/mnishi41/n/n2f3457e9f98e
でも1記事1,000円とか1文字0.2円とか、よほど金に困ってる人や騙されちゃってる人しかやらないね。(Webライター界隈も詐欺士が多いので)
稼げるジャンルを選んで、ポートフォリオをしっかり作って経験詰み上手く営業すれば、Webライターは稼げる人は稼げると思うけどね。
https://b.hatena.ne.jp/entry/s/av.watch.impress.co.jp/docs/series/dal/1248155.html
>過去50年間の通信品質評価の研究成果・標準を全無視。通信品質には、音質の他に遅延・輻輳回避・パケ落ち回復など様々な要素が絡み、それらを考慮したPESQ値・R値・MOS値等で評価しなければいけない。
あれ?コメント直したのか?もっと攻撃的な感じだった筈だが…罵倒もしてた記憶が。誰か残していない?
たかぎひろみちゅ氏とかにも感じるんだが、自分の知識に対する圧倒的な自信と、それに反する相手への徹底的な攻撃性「ウソつくな!」「ば~か!」みたいな罵倒も躊躇しない感じ。「言っている事は正しいんだろうが、こっちに付きたくはない…」と思わせる排他性とエリート意識。それが私のはてブ感を感じるブコメ。
ウェブマスター オフィスアワー 2019 年 10 月 02 日 メモ(※所々抜け漏れあり)
https://www.youtube.com/watch?v=bBurTQBqhS0
11/25 Webmaster Conference Tokyo:今週か来週の早い段階で情報を公開する予定
最新情報への対応や常に変動するランキングに対応させるためのもの
「何かまずいところがないだろうか?」という視点でサイトに着手するのは不要
客観的にいいのか悪いのかを知るために定期的なユーザーテストの実施とか、
お互いにレビューし合う習慣を付けるとか
品質評価ガイドラインとかE-A-Tとかは個人的には見なくても良いと思うが、
Q.RankBrainにおける更新性や更新の有無による効果はあるのか?
A.オフィスアワーでランキング要素の可能性について言及するのは難しい。言えることはコンテンツの内容を改善してくださいということだけ。もし、更新性が影響すると言ってしまうとみんながそっちに走ってしまうので。
Q.被リンクではページランクとドメインランクのどちらを重要視していますか?
A.ショートアンサーとしてはどちらでもありません。
仮にドメインランクが重要ですと言ったら何が起こるでしょうか?オールドドメインの買い占めが発生してしまうでしょう。
例えばコンテンツの質を見るに、Wikipediaに関連リンクを貼られるとかそのくらいの影響力があるのかなどを見てみると良いでしょう。
筆者注:
【図解】グーグルのリンク評価20の原則【2019年版】(前編#1~#10) | Moz - SEOとインバウンドマーケティングの実践情報 | Web担当者Forum
https://webtan.impress.co.jp/e/2019/09/30/34042
初心者必見!SEO対策の基本を5分で完全解説【2019年最新版】
https://emma.tools/magazine/seo-basics/
↑これら記事とか?
A.Googleのアルゴリズムも完璧ではないので、アップデートで再評価される可能性はある。
メインのクエリでユーザーが自身のサービスが頭に浮かぶような存在になれるかどうか。
Q.robots.txtでブロックしていないURLなのに、カバレッジでrobots.txtでブロックされていますというエラーが出る
A.色々確認中ではありますが、私が調べた範疇では問題ありません。Search Consoleのフィードバックも送ってください。その際、スクリーンショットだけではなく、テキストで問題点も添えてください。
Q.サイト内画像をサムネイルとして表示したい。Googleが推奨する方法がありませんか?
A.特にそのやり方については公開はしておりません。Googleが良いと思った画像だけを採用します。
強いて対策を言えば、画像のヘルプを参考に画像の情報をGoogleに伝えるようにしてください。
A.確認しましたが、Search Consoleに表示されています。
タイムラグがあるかもしれませんがDisallowされていませんか?確認してみてください。
Q.HTTPSのSearch Consoleは追加した方が良い?重複コンテンツになりますか??
A.追加した方が良いです。
重複コンテンツによって、起こるのはどちらかのコンテンツが上位表示される可能性があるということ。
共倒れになるということはありません。
そのクエリで頭に浮かぶくらいの存在になっているかどうかです。
Q.セパレートURLにおいてMFI後のcanonicalURLの設定について
正規化とは同等のページ内容のURLが複数あるからこそ行うもの。
canonicalよりも、リダイレクトでやってみてはどうでしょうか?
Q.検索パフォーマンスのデータの収集開始タイミングはいつから??
A.基本的には登録前のデータも取れるはずですが、違うケースもあればフィードバックで教えて下さい。
Q.Search Consoleのプロパティへの表示について、所有者として確認されてから6日経ってもプロパティに表示されていません
A.何らかの判断で時間がかかったのだと思います。通常は数日ですが、遅れたのは新規サイトであることが要因である可能性があることです。なにか不具合ありましたらSearch Consoleへフィードバックをぜひお願いします。
A.かなり困っているご様子ですので取り上げましたが、当フォーラムでは対象外の話題ですのでウェブ検索フォーラムへ送信願います。
Q.max-image-preview robots meta の値を確認するには?
A.まだ反映されていないのでもうちょっと待てば反映されます。
Q.Search ConsoleのタイムゾーンについてPTからPSTとPDTに切り替わりますか?
A.切り替わります!!
Q.ドメインを変えずにサイト名だけを変えると検索順位はどう変わる?
A.サイト名ほど大きな要素を変えてしまうのは影響すると思います。
どういうサイト名に変えるのかも重要。ユーザーにとってわかりやすくなるとかであれば、長期的には有効になるかもしれません。
Q.max-image-preview でlargeを設定するとDiscoverに表示されやすいと聞きましたがAMP対応しているだけでDiscoverに表示されやすくなりますか?
A.AMPでもmax-image-previewでlargeでもどっちでも対応可能です。
Q.クロールエラーが特定できない件について、1月のオフィスアワーにてホスティング会社に相談してみては?との回答で、のち、6月に検証中とのことでしたがあれからいかがでしょうか?
A.あまり気にされなくても良いです。ただ、間違ったエラーが表示されないようにするためにエンジニアも調整中ではあります。
こういうエラーに気づかれましたらSearch Consoleのフィードバックをぜひお願いします。
次回は10月後半か11月前半の予定です
言いたいことはよく分かるよ。
要は、スター数による評価には、どんな人によるスター(肯定)なのかが斟酌されないから、
アホによる+1と知恵者による+1が同列に見えてしまう、そのグロテスクさが嫌悪感をもよおすのだよね。
これからの時代のソーシャル評価システムには、重み付けが必要不可欠だと常々思っている。
AIなどの研究がうまいこといけば、ネット上の言論の品質評価ができるようになるはずだ。
いまはネット上で目立っていて、思考を侵食してきがちな類の論、たとえば、門外漢による浅はかでシンプルな暴論や排斥論、
アスペルガー障害を疑うレベルの「汲み取る力」欠乏ゆえの難癖、そいうった類の不適切具合が可視化されるようになる。
そうすると、そういった論に足を引っ張られず、知的で建設的なコミュニケーションがネットで成り立つようになる。
きっと、技術が進めば、サイレントマジョリティの良識がもっと見えやすくなる。
その良識に至る複雑で複合的な発想のプロセスが、凝り固まった考えの人にももっと伝わりやすくなる。
そういう時代がきっと来ると思うんだけどなぁ。
そういう考え方もアリ、そういう正論もある、という所から見た歪んだ世界を表現したいのだろうけどそういう考え方は無いしそういう正論もないよ。
その思考の原点となる「負ける」って何に対してどうなる状況を言っているのか言ってる本人もわかってない。
資本をたかめることか経常利益をあげることか給与を多くすることか社員の品質評価をたかめることかどれかを決めかねたあげく、だれかに良いといってもらえそうなものは全部と思っているのだろう。
マラソンで何回優勝してもドーピングしたり無理な走行で寿命を縮めたり公害や事故にあったり外的要因から非難をされたりする可能性を含めていないようだ。
そもそも何に勝つのかも考えてないだろう。
個人という単位で方向性を問うなら個人の価値に帰結するものだ。
個人が会社の仕組みについて問うのであればそれは個人と会社の関係性であって会社の方向性という個人に影響はあれど個人の意思決定等とは全く関係のないものである。
結局、勝ち負けや会社や休日といった人気ワードを撒き散らしたレプリカで本質を突いた気になっているまたは気にさせるこを目的としているだけということになる。
例えて言うなら、プリンセスダイヤをちりばめた本物のお姫様ペンダント、という夜店で売ってるプラスチックの玩具と同じ意味合いを持つ。
それが本物であるという思い入れが個人にあるならそれはそれでいいだろうし、その個人の思いが本質でありつづけられるのは個人の心のなかだけという程度のことは理解できるだろう。
その人気のワードをちりばめているという事実だけで馳せる思いを共感しようとさせるのは、一般に気持ち悪いということも理解しているのだろう。
そんなに気持ち悪いアピールをつかって企業は単純で愚かな選択をしていると非難してみても、それは夜店の玩具の剣を昼間平日一般人にひけらかしてみようという行為に見えて滑稽だ。
そのしたいことに合致した内容を用いれば望み通りになるのだろうけれども、それでは期待した反応ではない。あくまで冗談であることはわかってほしいが真剣にそれをやっている姿が滑稽とも見せたい、というところから導き出された経験不足の結果だろう。
したいことを実践するのであればそんな安物のワードではなく世界的に有名な成功者の例を出してそうでもしないとどこに到達できないと明確にすれば良い。
しかし実際に身を呈して目的を達成する価値を言いたいわけではないのだろう。それをバカにしたいのだが著名人を露骨にバカにするのも批判しかあつまらない、それをバカにする自分の愚かさを指摘されて不快になる程度は想像がつくのだろう。
どこにでもある良い話系のなかに、そういう表現者がこまったとき先人からもらったありがたい一言というのはだいたい定番としてよくあるだろう。
安っぽい見かけで表現したいことを全部詰め込んでみました、といって満足できるのはその本質をしらない子供だけだということに主観的では気がつかないものなのかと呆れることも多いだろう。
実際世の中には、家に居場所がないから会社に毎日出たいむしろ帰りたくないという人間がいる。そしてそれは非常に邪魔で迷惑だ。
しかし家庭という問題を会社の評価と結びつけらえない場合、数値的には非常に優秀な人材に見えてしまう。
そんなことは想像がつかなかったのだろう。実際これは人事として非常に困難な対応を迫られる問題だ。
最終的には、きみの渾身のパフォーマンスに対して観客は困り顔で笑っている様子になる。
表面的にみればきみは満足な公演結果だろう。しかしそれはきみの想像している結果の方向性と合致してはいない。
満足な結果に成功を確信しつつ前進していけば、その間違った方向でいつか「どこで間違っていたのだろう」と振り返ることになる。
その時のためにここに記しておこう。
ここもきみの分岐を間違えた一つだったと。