// ================================================================================================ // // Wikipedia用の翻訳支援処理実装クラスソース // // // Copyright (C) 2012 Honeplus. All rights reserved. // // Honeplus // ================================================================================================ namespace Honememo.Wptscs.Logics { using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Net; using System.Text; using System.Windows.Forms; using Honememo.Models; using Honememo.Parsers; using Honememo.Utilities; using Honememo.Wptscs.Models; using Honememo.Wptscs.Parsers; using Honememo.Wptscs.Properties; using Honememo.Wptscs.Utilities; using Honememo.Wptscs.Websites; /// /// MediaWiki用の翻訳支援処理実装クラスです。 /// public class MediaWikiTranslator : Translator { #region private変数 /// /// 用ロックオブジェクト。 /// private LockObject itemTableLock = new LockObject(); #endregion #region コンストラクタ /// /// MediaWikiでの翻訳支援処理を行うトランスレータを作成。 /// /// /// 別途プロパティに必要なパラメータを設定する必要あり。 /// 通常はにて設定ファイルから作成する。 /// public MediaWikiTranslator() { // このクラス用のロガーと、デフォルトの確認処理としてメッセージダイアログ版を設定 this.Logger = new MediaWikiLogger(); this.IsContinueAtInterwikiExisted = this.IsContinueAtInterwikiExistedWithDialog; } #endregion #region デリゲート /// /// 対象記事に言語間リンクが存在する場合の確認処理を表すデリゲート。 /// /// 言語間リンク先記事。 /// 処理を続行する場合true public delegate bool IsContinueAtInterwikiExistedDelegate(string interwiki); #endregion #region プロパティ /// /// 翻訳元言語のサイト。 /// public new MediaWiki From { get { return base.From as MediaWiki; } set { base.From = value; } } /// /// 翻訳先言語のサイト。 /// public new MediaWiki To { get { return base.To as MediaWiki; } set { base.To = value; } } /// /// 対象記事に言語間リンクが存在する場合の確認処理。 /// /// 確認を行わない場合null public IsContinueAtInterwikiExistedDelegate IsContinueAtInterwikiExisted { get; set; } #endregion #region メイン処理メソッド /// /// 翻訳支援処理実行部の本体。 /// ※継承クラスでは、この関数に処理を実装すること /// /// 記事名。 /// 処理が中断された場合。中断の理由はに出力される。 protected override void RunBody(string name) { // 対象記事を取得 MediaWikiPage article = this.GetTargetPage(name); if (article == null) { throw new ApplicationException("article is not found"); } // 対象記事に言語間リンクが存在する場合、処理を継続するか確認 // ※ 言語間リンク取得中は、処理状態を解析中に変更 MediaWikiLink interlanguage; using (var sm = this.StatusManager.Switch(Resources.StatusParsing)) { interlanguage = article.GetInterlanguage(this.To.Language.Code); } if (interlanguage != null) { // 確認処理の最中は処理時間をカウントしない(ダイアログ等を想定するため) this.Stopwatch.Stop(); if (this.IsContinueAtInterwikiExisted != null && !this.IsContinueAtInterwikiExisted(interlanguage.Title)) { throw new ApplicationException("user canceled"); } this.Stopwatch.Start(); this.Logger.AddResponse(Resources.LogMessageTargetArticleHadInterWiki, interlanguage.Title); } // 冒頭部を作成 this.Text += this.CreateOpening(article.Title); // 言語間リンク・定型句の変換、実行中は処理状態を解析中に設定 this.Logger.AddSeparator(); this.Logger.AddResponse(Resources.LogMessageStartParseAndReplace); using (var sm = this.StatusManager.Switch(Resources.StatusParsing)) { IElement element; using (MediaWikiParser parser = new MediaWikiParser(this.From)) { element = parser.Parse(article.Text); } this.Text += this.ReplaceElement(element, article).ToString(); } // 記事の末尾に新しい言語間リンクと、コメントを追記 this.Text += this.CreateEnding(article); // ダウンロードされるテキストがLFなので、最後にクライアント環境に合わせた改行コードに変換 // ※ダウンロード時に変換するような仕組みが見つかれば、そちらを使う // その場合、上のように\nをべたに吐いている部分を修正する this.Text = this.Text.Replace("\n", Environment.NewLine); } #endregion #region 他のクラスの処理をこのクラスにあわせて拡張したメソッド /// /// ログ出力によるエラー処理を含んだページ取得処理。 /// /// ページタイトル。 /// 取得したページ。ページが存在しない場合は null を返す。 /// 処理が成功した(404も含む)場合true、失敗した(通信エラーなど)の場合false /// trueの場合。 /// /// 本メソッドは、大きく3パターンの動作を行う。 /// /// 正常にページが取得できた → trueでページを設定、ログ出力無し /// 404など想定内の例外でページが取得できなかった → trueでページ無し、ログ出力無し /// 想定外の例外でページが取得できなかった → falseでページ無し、ログ出力有り /// or ApplicationExceptionで処理中断(アプリケーション設定のIgnoreErrorによる)。 /// /// また、実行中は処理状態をサーバー接続中に更新する。 /// 実行前後には終了要求のチェックも行う。 /// protected bool TryGetPage(string title, out MediaWikiPage page) { // &   等の特殊文字をデコードして、親クラスのメソッドを呼び出し Page p; bool success = base.TryGetPage(WebUtility.HtmlDecode(title), out p); page = p as MediaWikiPage; return success; } #endregion #region 冒頭/末尾ブロックの生成メソッド /// /// 変換後記事冒頭用の「'''日本語記事名'''([[英語|英]]: '''{{Lang|en|英語記事名}}''')」みたいなのを作成する。 /// /// 翻訳支援対象の記事名。 /// 冒頭部のテキスト。 protected virtual string CreateOpening(string title) { string langPart = String.Empty; IElement langLink = this.GetLanguageLink(); if (langLink != null) { langPart = langLink.ToString() + ": "; } string langBody = this.To.FormatLang(this.From.Language.Code, title); if (String.IsNullOrEmpty(langBody)) { langBody = title; } StringBuilder b = new StringBuilder("'''xxx'''"); b.Append(this.To.Language.FormatBracket(langPart + "'''" + langBody + "'''")); b.Append("\n\n"); return b.ToString(); } /// /// 変換後記事末尾用の新しい言語間リンクとコメントを作成する。 /// /// 翻訳支援対象の記事。 /// 末尾部のテキスト。 protected virtual string CreateEnding(MediaWikiPage page) { MediaWikiLink link = new MediaWikiLink(); link.Title = page.Title; link.Interwiki = this.From.Language.Code; return "\n\n" + link.ToString() + "\n" + String.Format( Resources.ArticleFooter, FormUtils.ApplicationName(), this.From.Language.Code, page.Title, page.Timestamp.HasValue ? page.Timestamp.Value.ToString("U") : String.Empty) + "\n"; } #endregion #region 要素の変換メソッド /// /// 渡されたページ要素の変換を行う。 /// /// ページ要素。 /// ページ要素を取得した変換元記事。 /// 変換後のページ要素。 protected virtual IElement ReplaceElement(IElement element, MediaWikiPage parent) { // ユーザーからの中止要求をチェック this.ThrowExceptionIfCanceled(); // 要素の型に応じて、必要な置き換えを行う if (element is MediaWikiTemplate) { // テンプレート return this.ReplaceTemplate((MediaWikiTemplate)element, parent); } else if (element is MediaWikiLink) { // 内部リンク return this.ReplaceLink((MediaWikiLink)element, parent); } else if (element is MediaWikiHeading) { // 見出し return this.ReplaceHeading((MediaWikiHeading)element, parent); } else if (element is MediaWikiVariable) { // 変数 return this.ReplaceVariable((MediaWikiVariable)element, parent); } else if (element is ListElement) { // 値を格納する要素 return this.ReplaceListElement((ListElement)element, parent); } // それ以外は、特に何もせず元の値を返す return element; } /// /// 内部リンクを解析し、変換先言語の記事へのリンクに変換する。 /// /// 変換元リンク。 /// ページ要素を取得した変換元記事。 /// 変換済みリンク。 protected virtual IElement ReplaceLink(MediaWikiLink link, MediaWikiPage parent) { // 記事名が存在しないor自記事内の別セクションへのリンクの場合、記事名絡みの処理を飛ばす if (!this.IsSectionLink(link, parent.Title)) { // 記事名の種類に応じて処理を実施 MediaWikiPage article = new MediaWikiPage(this.From, link.Title); bool child = false; if (link.IsSubpage()) { // サブページ(子)の場合だけ後で記事名を復元するので記録 child = link.Title.StartsWith("/"); // ページ名を完全な形に補完 string title = parent.Normalize(link); if (parent.Title.StartsWith(title)) { // サブページ(親)の場合、変換してもしょうがないのでセクションだけチェックして終了 if (!String.IsNullOrEmpty(link.Section)) { link.Section = this.ReplaceLinkSection(link.Section); link.ParsedString = null; } return link; } link.Title = title; } else if (!String.IsNullOrEmpty(link.Interwiki)) { // 言語間リンク・姉妹プロジェクトへのリンクの場合、変換対象外とする // ただし、先頭が : でない、翻訳先言語への言語間リンクだけは削除 return this.ReplaceLinkInterwiki(link); } else if (article.IsFile()) { // 画像の場合、名前空間を翻訳先言語の書式に変換、パラメータ部を再帰的に処理 return this.ReplaceLinkFile(link, parent); } else if (article.IsCategory() && !link.IsColon) { // カテゴリで記事へのリンクでない([[:Category:xxx]]みたいなリンクでない)場合、 // カテゴリ用の変換を実施 return this.ReplaceLinkCategory(link); } // 専用処理の無い内部リンクの場合、言語間リンクによる置き換えを行う string interWiki = this.GetInterlanguage(link); if (interWiki == null) { // 記事自体が存在しない(赤リンク)場合、リンクはそのまま } else if (interWiki == String.Empty) { // 言語間リンクが存在しない場合、可能なら{{仮リンク}}に置き換え if (!String.IsNullOrEmpty(this.To.LinkInterwikiFormat)) { return this.ReplaceLinkLinkInterwiki(link); } // 設定が無ければ [[:en:xxx]] みたいな形式に置換 link.Title = this.From.Language.Code + ':' + link.Title; link.IsColon = true; } else if (child) { // 言語間リンクが存在してサブページ(子)の場合、親ページ部分を消す // TODO: 兄弟や叔父のパターンも対処したい(ややこしいので現状未対応) link.Title = StringUtils.Substring(interWiki, interWiki.IndexOf('/')); } else { // 普通に言語間リンクが存在する場合、記事名を置き換え link.Title = interWiki; } if (link.PipeTexts.Count == 0 && interWiki != null) { // 表示名が存在しない場合、元の名前を表示名に設定 // 元の名前にはあればセクションも含む link.PipeTexts.Add( new TextElement(new MediaWikiLink { Title = article.Title, Section = link.Section } .GetLinkString())); } } // セクション部分([[#関連項目]]とか)を変換 if (!String.IsNullOrEmpty(link.Section)) { link.Section = this.ReplaceLinkSection(link.Section); } link.ParsedString = null; return link; } /// /// テンプレートを解析し、変換先言語の記事へのテンプレートに変換する。 /// /// 変換元テンプレート。 /// ページ要素を取得した変換元記事。 /// 変換済みテンプレート。 protected virtual IElement ReplaceTemplate(MediaWikiTemplate template, MediaWikiPage parent) { // システム変数({{PAGENAME}}とか)の場合は対象外 if (this.From.IsMagicWord(template.Title)) { return template; } // テンプレートは通常名前空間が省略されているので補完する string filledTitle = this.FillTemplateName(template, parent); // リンクを辿り、対象記事の言語間リンクを取得 string interWiki = this.GetInterlanguage(new MediaWikiTemplate(filledTitle)); if (interWiki == null) { // 記事自体が存在しない(赤リンク)場合、リンクはそのまま return template; } else if (interWiki == String.Empty) { // 言語間リンクが存在しない場合、[[:en:Template:xxx]]みたいな普通のリンクに置換 // おまけで、元のテンプレートの状態をコメントでつける ListElement list = new ListElement(); MediaWikiLink link = new MediaWikiLink(); link.IsColon = true; link.Title = this.From.Language.Code + ':' + filledTitle; list.Add(link); XmlCommentElement comment = new XmlCommentElement(); comment.Raw = ' ' + template.ToString() + ' '; list.Add(comment); return list; } else { // 言語間リンクが存在する場合、そちらを指すように置換 // : より前の部分を削除して出力(: が無いときは-1+1で0から) template.Title = interWiki.Substring(interWiki.IndexOf(':') + 1); // | の後に内部リンクやテンプレートが書かれている場合があるので、再帰的に処理する template.PipeTexts = this.ReplaceElements(template.PipeTexts, parent); template.ParsedString = null; return template; } } /// /// 指定された見出しに対して、対訳表による変換を行う。 /// /// 見出し。 /// ページ要素を取得した変換元記事。 /// 変換後の見出し。 protected virtual IElement ReplaceHeading(MediaWikiHeading heading, MediaWikiPage parent) { // 変換元ログ出力 this.Logger.AddSource(heading); // 定型句変換 StringBuilder oldText = new StringBuilder(); foreach (IElement e in heading) { oldText.Append(e.ToString()); } string newText = this.GetHeading(oldText.ToString().Trim()); if (newText != null) { // 対訳表による変換が行えた場合、変換先をログ出力し処理終了 heading.Clear(); heading.ParsedString = null; heading.Add(new XmlTextElement(newText)); this.Logger.AddDestination(heading); return heading; } // 対訳表に存在しない場合、内部要素を通常の変換で再帰的に処理 return this.ReplaceListElement(heading, parent); } /// /// 変数要素を再帰的に解析し、変換先言語の記事への要素に変換する。 /// /// 変換元変数要素。 /// ページ要素を取得した変換元記事。 /// 変換済み変数要素。 protected virtual IElement ReplaceVariable(MediaWikiVariable variable, MediaWikiPage parent) { // 変数、これ自体は処理しないが、再帰的に探索 string old = variable.Value.ToString(); variable.Value = this.ReplaceElement(variable.Value, parent); if (variable.Value.ToString() != old) { // 内部要素が変化した(置き換えが行われた)場合、変換前のテキストを破棄 variable.ParsedString = null; } return variable; } /// /// 要素を再帰的に解析し、変換先言語の記事への要素に変換する。 /// /// 変換元要素。 /// ページ要素を取得した変換元記事。 /// 変換済み要素。 protected virtual IElement ReplaceListElement(ListElement listElement, MediaWikiPage parent) { // 値を格納する要素、これ自体は処理しないが、再帰的に探索 for (int i = 0; i < listElement.Count; i++) { string old = listElement[i].ToString(); listElement[i] = this.ReplaceElement(listElement[i], parent); if (listElement[i].ToString() != old) { // 内部要素が変化した(置き換えが行われた)場合、変換前のテキストを破棄 listElement.ParsedString = null; } } return listElement; } #endregion #region 対訳表アクセスメソッド /// /// 対訳表に指定された記事名の情報が登録されているか? /// /// 記事名。 /// 指定した記事の情報が登録されている場合true /// 複数スレッドからのアクセスに対応する。また項目の対訳表が無い場合も動作する。 protected bool ContainsAtItemTable(string title) { if (this.ItemTable == null) { return false; } // 以下マルチスレッドで使われることも想定して対訳表へのアクセス時はロック // ※ 対訳表へのアクセス時は記事名をデコードしておく string decodedTitle = WebUtility.HtmlDecode(title); lock (this.itemTableLock.GetObject(decodedTitle.ToLower())) { // 対訳表へのキーとしてはHTMLデコードした記事名を使用する return this.ItemTable.ContainsKey(decodedTitle); } } /// /// 指定されたコードでの見出しに相当する、別の言語での見出しを取得。 /// /// 翻訳元言語での見出し。 /// 翻訳先言語での見出し。値が存在しない場合はnull /// 見出しの対訳表が無い場合も動作する。 protected string GetHeading(string heading) { if (this.HeadingTable == null) { return null; } return this.HeadingTable.GetWord(heading); } #endregion #region 言語間リンク取得メソッド /// /// ロガーに取得結果を出力しつつ、指定された要素の記事の翻訳先言語への言語間リンクを返す。 /// /// 内部リンク要素。 /// 言語間リンク先の記事名。見つからない場合は空。ページ自体が存在しない場合はnull /// 取得処理では対訳表を使用する。また新たな取得結果は対訳表に追加する。 protected string GetInterlanguage(MediaWikiLink element) { // 翻訳元をロガーに出力 this.Logger.AddSource(element); string title = element.Title; TranslationDictionary.Item item; if (this.ItemTable == null) { // 対訳表が指定されていない場合は、使わずに言語間リンクを探索して終了 return this.GetInterlanguageWithCreateCache(title, out item); } // 対訳表を使用して言語間リンクを探索。 // 以下マルチスレッドで使われることも想定して対訳表へのアクセス時はロック(記事名単位)。 // また、対訳表へのアクセス時は記事名をデコードしておく。 string decodedTitle = WebUtility.HtmlDecode(title); lock (this.itemTableLock.GetObject(decodedTitle.ToLower())) { if (this.ItemTable.TryGetValue(decodedTitle, out item)) { // 存在する場合はその値を使用 if (!String.IsNullOrWhiteSpace(item.Alias)) { // リダイレクトがあれば、そのメッセージも表示 this.Logger.AddAlias(new MediaWikiLink(item.Alias)); } if (!String.IsNullOrEmpty(item.Word)) { this.Logger.AddDestination(new MediaWikiLink(item.Word), true); return item.Word; } else { this.Logger.AddDestination(new TextElement(Resources.LogMessageInterWikiNotFound), true); return String.Empty; } } // 対訳表に存在しない場合は、普通に取得し表に記録 // ※ こちらは内部でデコードしているためデコードした記事名を渡してはならない string interlanguage = this.GetInterlanguageWithCreateCache(title, out item); if (interlanguage != null) { // ページ自体が存在しない場合を除き、結果を対訳表に登録 // ※ キャッシュとしては登録すべきかもしれないが、一応"対訳表"であるので this.ItemTable[decodedTitle] = item; } return interlanguage; } } /// /// ロガーに取得結果を出力しつつ、指定された記事の翻訳先言語への言語間リンクを返す。 /// キャッシュ用の処理結果情報も出力する。 /// /// 記事名。 /// キャッシュ用の処理結果情報。 /// 言語間リンク先の記事名。見つからない場合は空。ページ自体が存在しない場合はnull private string GetInterlanguageWithCreateCache(string title, out TranslationDictionary.Item item) { // 記事名から記事を探索 item = new TranslationDictionary.Item { Timestamp = DateTime.UtcNow }; MediaWikiPage page = this.GetDestinationPage(title); if (page != null && page.IsRedirect()) { // リダイレクトの場合、リダイレクトである旨出力し、その先の記事を取得 this.Logger.AddAlias(new MediaWikiLink(page.Redirect.Title)); item.Alias = page.Redirect.Title; page = this.GetDestinationPage(page.Redirect.Title); } if (page == null) { // ページ自体が存在しない場合はnull return null; } // 記事があればその言語間リンクを取得 MediaWikiLink interlanguage = page.GetInterlanguage(this.To.Language.Code); if (interlanguage != null) { item.Word = interlanguage.Title; this.Logger.AddDestination(interlanguage); } else { // 見つからない場合は空 item.Word = String.Empty; this.Logger.AddDestination(new TextElement(Resources.LogMessageInterWikiNotFound)); } return item.Word; } /// /// 変換先の記事を取得する。 /// /// ページタイトル。 /// 取得したページ。ページが存在しない場合は null を返す。 /// 記事が無い場合、通信エラーなど例外が発生した場合は、エラーログを出力する。 private MediaWikiPage GetDestinationPage(string title) { MediaWikiPage page; if (this.TryGetPage(title, out page) && page == null) { // 記事が存在しない場合だけ、変換先に「記事無し」を出力 // ※ エラー時のログはTryGetPageが自動的に出力 this.Logger.AddDestination(new TextElement(Resources.LogMessageLinkArticleNotFound)); } return page; } #endregion #region 要素の変換関連その他メソッド /// /// 同記事内の別のセクションを指すリンク([[#関連項目]]とか[[自記事#関連項目]]とか)か? /// /// 判定する内部リンク。 /// 内部リンクがあった記事。 /// セクション部分のみ変換済みリンク。 private bool IsSectionLink(MediaWikiLink link, string parent) { // 記事名が指定されていない、または記事名が自分の記事名で // 言語コード等も特に無く、かつセクションが指定されている場合 // (記事名もセクションも指定されていない・・・というケースもありえるが、 // その場合他に指定できるものも思いつかないので通す) return String.IsNullOrEmpty(link.Title) || (link.Title == parent && String.IsNullOrEmpty(link.Interwiki) && !String.IsNullOrEmpty(link.Section)); } /// /// 内部リンクのセクション部分([[#関連項目]]とか)の定型句変換を行う。 /// /// セクション文字列。 /// セクション部分のみ変換済みリンク。 private string ReplaceLinkSection(string section) { // セクションが指定されている場合、定型句変換を通す string heading = this.GetHeading(section); return heading != null ? heading : section; } /// /// 言語間リンク指定の内部リンクを解析し、不要であれば削除する。 /// /// 変換元言語間リンク。 /// 変換済み言語間リンク。 private IElement ReplaceLinkInterwiki(MediaWikiLink link) { // 言語間リンク・姉妹プロジェクトへのリンクの場合、変換対象外とする // ただし、先頭が : でない、翻訳先言語への言語間リンクだけは削除 if (!link.IsColon && link.Interwiki == this.To.Language.Code) { return new TextElement(); } return link; } /// /// カテゴリ指定の内部リンクを解析し、変換先言語のカテゴリへのリンクに変換する。 /// /// 変換元カテゴリ。 /// 変換済みカテゴリ。 private IElement ReplaceLinkCategory(MediaWikiLink link) { // リンクを辿り、対象記事の言語間リンクを取得 string interWiki = this.GetInterlanguage(link); if (interWiki == null) { // 記事自体が存在しない(赤リンク)場合、リンクはそのまま return link; } else if (interWiki == String.Empty) { // 言語間リンクが存在しない場合、コメントで元の文字列を保存した後 // [[:en:xxx]]みたいな形式に置換。また | 以降は削除する XmlCommentElement comment = new XmlCommentElement(); comment.Raw = ' ' + link.ToString() + ' '; link.Title = this.From.Language.Code + ':' + link.Title; link.IsColon = true; link.PipeTexts.Clear(); link.ParsedString = null; ListElement list = new ListElement(); list.Add(link); list.Add(comment); return list; } else { // 普通に言語間リンクが存在する場合、記事名を置き換え link.Title = interWiki; link.ParsedString = null; return link; } } /// /// ファイル指定の内部リンクを解析し、変換先言語で参照可能なファイルへのリンクに変換する。 /// /// 変換元リンク。 /// ページ要素を取得した変換元記事。 /// 変換済みリンク。 private IElement ReplaceLinkFile(MediaWikiLink link, MediaWikiPage parent) { // 名前空間を翻訳先言語の書式に変換、またパラメータ部を再帰的に処理 link.Title = this.ReplaceLinkNamespace(link.Title, this.To.FileNamespace); link.PipeTexts = this.ReplaceElements(link.PipeTexts, parent); link.ParsedString = null; return link; } /// /// 記事名のうち名前空間部分の変換先言語への変換を行う。 /// /// 変換元記事名。 /// 名前空間のID。 /// 変換済み記事名。 private string ReplaceLinkNamespace(string title, int id) { // 名前空間だけ翻訳先言語の書式に変換 IgnoreCaseSet names; if (!this.To.Namespaces.TryGetValue(id, out names)) { // 翻訳先言語に相当する名前空間が無い場合、何もしない return title; } // 記事名の名前空間部分を置き換えて返す return names.FirstOrDefault() + title.Substring(title.IndexOf(':')); } /// /// 内部リンクを他言語版への{{仮リンク}}等に変換する。。 /// /// 変換元言語間リンク。 /// 変換済み言語間リンク。 private IElement ReplaceLinkLinkInterwiki(MediaWikiLink link) { // 仮リンクにはセクションの指定が可能なので、存在する場合付加する // ※ 渡されたlinkをそのまま使わないのは、余計なゴミが含まれる可能性があるため MediaWikiLink title = new MediaWikiLink { Title = link.Title, Section = link.Section }; string langTitle = title.GetLinkString(); if (!String.IsNullOrEmpty(title.Section)) { // 変換先言語版のセクションは、セクションの変換を通したものにする title.Section = this.ReplaceLinkSection(title.Section); } // 表示名は、設定されていればその値を、なければ変換元言語の記事名を使用 string label = langTitle; if (link.PipeTexts.Count > 0) { label = link.PipeTexts.Last().ToString(); } // 書式化した文字列を返す // ※ {{仮リンク}}を想定しているが、やろうと思えば何でもできるのでテキストで処理 return new TextElement(this.To.FormatLinkInterwiki(title.GetLinkString(), this.From.Language.Code, langTitle, label)); } /// /// 渡された要素リストに対してによる変換を行う。 /// /// 変換元要素リスト。 /// ページ要素を取得した変換元記事。 /// 変換済み要素リスト。 private IList ReplaceElements(IList elements, MediaWikiPage parent) { if (elements == null) { return null; } IList result = new List(); foreach (IElement e in elements) { result.Add(this.ReplaceElement(e, parent)); } return result; } /// /// テンプレート名に必要に応じて名前空間を補完する。 /// /// テンプレート。 /// ページ要素を取得した変換元記事。 /// 補完済みのテンプレート名。 private string FillTemplateName(MediaWikiTemplate template, MediaWikiPage parent) { // プレフィックスが付いた記事名を作成 string filledTitle = parent.Normalize(template); if (filledTitle == template.Title || template.IsSubpage()) { // 補完が不要な場合、またはサブページだった場合、ここで終了 return filledTitle; } // プレフィックスが付いた記事名が実際に存在するかを確認 // ※ 不要かもしれないが、マジックワードの漏れ等の誤検出を減らしたいので if (this.ContainsAtItemTable(filledTitle)) { // 対訳表に記事名が確認されている場合、既知の名前として確定 return filledTitle; } // 実際に頭にプレフィックスを付けた記事名でアクセスし、存在するかをチェック // TODO: GetInterWikiの方とあわせ、テンプレートでは2度GetPageが呼ばれている。可能であれば共通化する MediaWikiPage page = null; try { // 記事が存在する場合、プレフィックスをつけた名前を使用 page = this.From.GetPage(WebUtility.HtmlDecode(filledTitle)) as MediaWikiPage; return filledTitle; } catch (FileNotFoundException) { // 記事が存在しない場合、元のページ名を使用 return template.Title; } catch (Exception e) { // 想定外の例外が発生した場合 if (!Settings.Default.IgnoreError) { // エラーを無視しない場合、ここで翻訳支援処理を中断する this.Logger.AddError(e); throw new ApplicationException(e.Message, e); } // 続行する場合は、とりあえずプレフィックスをつけた名前で処理 this.Logger.AddResponse(Resources.LogMessageTemplateNameUnidentified, template.Title, filledTitle, e.Message); return filledTitle; } } #endregion #region その他内部処理用メソッド /// /// 翻訳支援対象のページを取得。 /// /// 翻訳支援対象の記事名。 /// 取得したページ。取得失敗時はnull /// /// ここで取得した記事のURIを、以後の翻訳支援処理で使用するRefererとして登録 /// (ここで処理しているのは、リダイレクトの場合のリダイレクト先への /// アクセス時にもRefererを入れたかったから。 /// リダイレクトの場合は、最終的には転送先ページのURIとなる)。 /// private MediaWikiPage GetTargetPage(string title) { // 指定された記事をWikipediaから取得、リダイレクトの場合その先まで探索 // ※ この処理ではキャッシュは使用しない。 // ※ 万が一相互にリダイレクトしていると無限ループとなるが、特に判定はしない。 // ユーザーが画面上から止めることを期待。 this.Logger.AddMessage(Resources.LogMessageGetTargetArticle, this.From.Location, title); MediaWikiPage page; for (string s = title; this.TryGetPage(s, out page); s = page.Redirect.Title) { if (page == null) { // 記事が存在しない場合、メッセージを出力して終了 this.Logger.AddResponse(Resources.LogMessageTargetArticleNotFound); break; } // 取得した記事のURIを以後のアクセスで用いるRefererとして登録 this.From.WebProxy.Referer = page.Uri.ToString(); this.To.WebProxy.Referer = page.Uri.ToString(); if (!page.IsRedirect()) { // リダイレクト以外ならこれで終了 break; } // リダイレクトであれば、さらにその先の記事を取得 this.Logger.AddResponse(Resources.LogMessageRedirect + " " + new MediaWikiLink(page.Redirect.Title).ToString()); } return page; } /// /// 指定した言語での言語名称を [[言語名称|略称]]の内部リンクで取得。 /// /// /// [[言語名称|略称]]の内部リンク。登録されていない場合null。 /// サーバーにそうした記事が存在しない場合、リンクではなく言語名称or略称の文字列を返す。 /// private IElement GetLanguageLink() { // 言語情報を取得 Language.LanguageName name; if (!this.From.Language.Names.TryGetValue(this.To.Language.Code, out name)) { return null; } // 略称を取得 IElement shortName = null; if (!String.IsNullOrEmpty(name.ShortName)) { shortName = new TextElement(name.ShortName); } if (this.To.HasLanguagePage) { // サーバーにこの言語の記事が存在することが期待される場合、 // 内部リンクとして返す MediaWikiLink link = new MediaWikiLink(name.Name); if (shortName != null) { link.PipeTexts.Add(shortName); } return link; } else if (shortName != null) { // 存在しない場合、まずあれば略称を返す return shortName; } else { // 無ければ言語名を返す return new TextElement(name.Name); } } /// /// 対象記事に言語間リンクが存在する場合にメッセージダイアログでユーザーに確認する処理。 /// /// 言語間リンク先記事。 /// 処理を続行する場合true private bool IsContinueAtInterwikiExistedWithDialog(string interwiki) { // 確認ダイアログを表示 if (MessageBox.Show( String.Format(Resources.QuestionMessageArticleExisted, interwiki), Resources.QuestionTitle, MessageBoxButtons.YesNo, MessageBoxIcon.Question) == DialogResult.No) { // 中断の場合、同じメッセージをログにも表示 this.Logger.AddSeparator(); this.Logger.AddMessage(Resources.QuestionMessageArticleExisted, interwiki); return false; } return true; } #endregion } }