OSDN Git Service

BugTrack/2411 SAML plugin: PukiWiki as a SAML service provider
[pukiwiki/pukiwiki.git] / lib / init.php
1 <?php
2 // PukiWiki - Yet another WikiWikiWeb clone.
3 // init.php
4 // Copyright
5 //   2002-2016 PukiWiki Development Team
6 //   2001-2002 Originally written by yu-ji
7 // License: GPL v2 or (at your option) any later version
8 //
9 // Init PukiWiki here
10
11 // PukiWiki version / Copyright / Licence
12
13 define('S_VERSION', '1.5.1');
14 define('S_COPYRIGHT',
15         '<strong>PukiWiki ' . S_VERSION . '</strong>' .
16         ' &copy; 2001-2016' .
17         ' <a href="http://pukiwiki.osdn.jp/">PukiWiki Development Team</a>'
18 );
19
20 /////////////////////////////////////////////////
21 // Session security options
22
23 ini_set('session.use_strict_mode', 1);
24 ini_set('session.use_cookies', 1);
25 ini_set('session.use_only_cookies', 1);
26
27 /////////////////////////////////////////////////
28 // Init server variables
29
30 // Comapat and suppress notices
31 if (!isset($HTTP_SERVER_VARS)) $HTTP_SERVER_VARS = array();
32
33 foreach (array('SCRIPT_NAME', 'SERVER_ADMIN', 'SERVER_NAME',
34         'SERVER_PORT', 'SERVER_SOFTWARE') as $key) {
35         define($key, isset($_SERVER[$key]) ? $_SERVER[$key] : '');
36         unset(${$key}, $_SERVER[$key], $HTTP_SERVER_VARS[$key]);
37 }
38
39 /////////////////////////////////////////////////
40 // Init grobal variables
41
42 $foot_explain = array();        // Footnotes
43 $related      = array();        // Related pages
44 $head_tags    = array();        // XHTML tags in <head></head>
45
46 /////////////////////////////////////////////////
47 // Time settings
48
49 define('LOCALZONE', date('Z'));
50 define('UTIME', time() - LOCALZONE);
51 define('MUTIME', getmicrotime());
52
53 /////////////////////////////////////////////////
54 // Require INI_FILE
55
56 define('INI_FILE',  DATA_HOME . 'pukiwiki.ini.php');
57 $die = '';
58 if (! file_exists(INI_FILE) || ! is_readable(INI_FILE)) {
59         $die .= 'File is not found. (INI_FILE)' . "\n";
60 } else {
61         require(INI_FILE);
62 }
63 if ($die) die_message(nl2br("\n\n" . $die));
64
65 /////////////////////////////////////////////////
66 // INI_FILE: LANG に基づくエンコーディング設定
67
68 // MB_LANGUAGE: mb_language (for mbstring extension)
69 //   'uni'(means UTF-8), 'English', or 'Japanese'
70 // SOURCE_ENCODING: Internal content encoding (for mbstring extension)
71 //   'UTF-8', 'ASCII', or 'EUC-JP'
72 // CONTENT_CHARSET: Internal content encoding = Output content charset
73 //    (for DTD, htmlsc())
74 //   'UTF-8', 'iso-8859-1', 'EUC-JP' or ...
75
76 switch (LANG){
77 case 'en': define('MB_LANGUAGE', 'English' ); break;
78 case 'ja': define('MB_LANGUAGE', 'Japanese'); break;
79 case 'ko': define('MB_LANGUAGE', 'Korean'  ); break; //UTF-8 only
80         // See BugTrack2/13 for all hack about Korean support, //UTF-8 only
81         // and give us your report!                            //UTF-8 only
82 default: die_message('No such language "' . LANG . '"'); break;
83 }
84
85 define('PKWK_UTF8_ENABLE', 1); //UTF-8 only
86 if (defined('PKWK_UTF8_ENABLE')) {
87         define('SOURCE_ENCODING', 'UTF-8');
88         define('CONTENT_CHARSET', 'UTF-8');
89 } else {
90         switch (LANG){
91         case 'en':
92                 define('SOURCE_ENCODING', 'ASCII');
93                 define('CONTENT_CHARSET', 'iso-8859-1');
94                 break;
95         case 'ja':
96                 define('SOURCE_ENCODING', 'EUC-JP');
97                 define('CONTENT_CHARSET', 'EUC-JP');
98                 break;
99         }
100 }
101
102 mb_language(MB_LANGUAGE);
103 mb_internal_encoding(SOURCE_ENCODING);
104 mb_http_output('pass');
105 mb_detect_order('auto');
106
107 /////////////////////////////////////////////////
108 // INI_FILE: Require LANG_FILE
109
110 define('LANG_FILE_HINT', DATA_HOME . LANG . '.lng.php');        // For encoding hint
111 define('LANG_FILE',      DATA_HOME . UI_LANG . '.lng.php');     // For UI resource
112 $die = '';
113 foreach (array('LANG_FILE_HINT', 'LANG_FILE') as $langfile) {
114         if (! file_exists(constant($langfile)) || ! is_readable(constant($langfile))) {
115                 $die .= 'File is not found or not readable. (' . $langfile . ')' . "\n";
116         } else {
117                 require_once(constant($langfile));
118         }
119 }
120 if ($die) die_message(nl2br("\n\n" . $die));
121
122 /////////////////////////////////////////////////
123 // LANG_FILE: Init encoding hint
124
125 define('PKWK_ENCODING_HINT', isset($_LANG['encode_hint'][LANG]) ? $_LANG['encode_hint'][LANG] : '');
126 unset($_LANG['encode_hint']);
127
128 /////////////////////////////////////////////////
129 // LANG_FILE: Init severn days of the week
130
131 $weeklabels = $_msg_week;
132
133 /////////////////////////////////////////////////
134 // INI_FILE: Init $script
135
136 if (isset($script)) {
137         get_script_uri($script); // Init manually
138 } else {
139         $script = get_script_uri(); // Init automatically
140 }
141
142 // INI_FILE: Auth settings
143 if (isset($auth_type) && $auth_type === AUTH_TYPE_SAML) {
144         $auth_external_login_url_base = get_script_uri() . '?//cmd.saml//sso';
145 }
146
147
148 /////////////////////////////////////////////////
149 // INI_FILE: $agents:  UserAgentの識別
150
151 $ua = 'HTTP_USER_AGENT';
152 $user_agent = $matches = array();
153
154 $user_agent['agent'] = isset($_SERVER['HTTP_USER_AGENT']) ? $_SERVER['HTTP_USER_AGENT'] : '';
155 unset(${$ua}, $_SERVER[$ua], $HTTP_SERVER_VARS[$ua], $ua);      // safety
156
157 foreach ($agents as $agent) {
158         if (preg_match($agent['pattern'], $user_agent['agent'], $matches)) {
159                 $user_agent['profile'] = isset($agent['profile']) ? $agent['profile'] : '';
160                 $user_agent['name']    = isset($matches[1]) ? $matches[1] : ''; // device or browser name
161                 $user_agent['vers']    = isset($matches[2]) ? $matches[2] : ''; // 's version
162                 break;
163         }
164 }
165 unset($agents, $matches);
166
167 // Profile-related init and setting
168 define('UA_PROFILE', isset($user_agent['profile']) ? $user_agent['profile'] : '');
169
170 define('UA_INI_FILE', DATA_HOME . UA_PROFILE . '.ini.php');
171 if (! file_exists(UA_INI_FILE) || ! is_readable(UA_INI_FILE)) {
172         die_message('UA_INI_FILE for "' . UA_PROFILE . '" not found.');
173 } else {
174         require(UA_INI_FILE); // Also manually
175 }
176
177 define('UA_NAME', isset($user_agent['name']) ? $user_agent['name'] : '');
178 define('UA_VERS', isset($user_agent['vers']) ? $user_agent['vers'] : '');
179 unset($user_agent);     // Unset after reading UA_INI_FILE
180
181 /////////////////////////////////////////////////
182 // ディレクトリのチェック
183
184 $die = '';
185 foreach(array('DATA_DIR', 'DIFF_DIR', 'BACKUP_DIR', 'CACHE_DIR') as $dir){
186         if (! is_writable(constant($dir)))
187                 $die .= 'Directory is not found or not writable (' . $dir . ')' . "\n";
188 }
189
190 // 設定ファイルの変数チェック
191 $temp = '';
192 foreach(array('rss_max', 'page_title', 'note_hr', 'related_link', 'show_passage',
193         'rule_related_str', 'load_template_func') as $var){
194         if (! isset(${$var})) $temp .= '$' . $var . "\n";
195 }
196 if ($temp) {
197         if ($die) $die .= "\n"; // A breath
198         $die .= 'Variable(s) not found: (Maybe the old *.ini.php?)' . "\n" . $temp;
199 }
200
201 $temp = '';
202 foreach(array('LANG', 'PLUGIN_DIR') as $def){
203         if (! defined($def)) $temp .= $def . "\n";
204 }
205 if ($temp) {
206         if ($die) $die .= "\n"; // A breath
207         $die .= 'Define(s) not found: (Maybe the old *.ini.php?)' . "\n" . $temp;
208 }
209
210 if($die) die_message(nl2br("\n\n" . $die));
211 unset($die, $temp);
212
213 /////////////////////////////////////////////////
214 // 必須のページが存在しなければ、空のファイルを作成する
215
216 foreach(array($defaultpage, $whatsnew, $interwiki) as $page){
217         if (! is_page($page)) pkwk_touch_file(get_filename($page));
218 }
219
220 /////////////////////////////////////////////////
221 // 外部からくる変数のチェック
222
223 // Prohibit $_GET attack
224 foreach (array('msg', 'pass') as $key) {
225         if (isset($_GET[$key])) die_message('Sorry, already reserved: ' . $key . '=');
226 }
227
228 // Expire risk
229 unset($HTTP_GET_VARS, $HTTP_POST_VARS); //, 'SERVER', 'ENV', 'SESSION', ...
230 unset($_REQUEST);       // Considered harmful
231
232 // Remove null character etc.
233 $_GET    = input_filter($_GET);
234 $_POST   = input_filter($_POST);
235 $_COOKIE = input_filter($_COOKIE);
236
237 // 文字コード変換 ($_POST)
238 // <form> で送信された文字 (ブラウザがエンコードしたデータ) のコードを変換
239 // POST method は常に form 経由なので、必ず変換する
240 //
241 if (isset($_POST['encode_hint']) && $_POST['encode_hint'] != '') {
242         // do_plugin_xxx() の中で、<form> に encode_hint を仕込んでいるので、
243         // encode_hint を用いてコード検出する。
244         // 全体を見てコード検出すると、機種依存文字や、妙なバイナリ
245         // コードが混入した場合に、コード検出に失敗する恐れがある。
246         $encode = mb_detect_encoding($_POST['encode_hint']);
247         mb_convert_variables(SOURCE_ENCODING, $encode, $_POST);
248
249 } else if (isset($_POST['charset']) && $_POST['charset'] != '') {
250         // TrackBack Ping で指定されていることがある
251         // うまくいかない場合は自動検出に切り替え
252         if (mb_convert_variables(SOURCE_ENCODING,
253             $_POST['charset'], $_POST) !== $_POST['charset']) {
254                 mb_convert_variables(SOURCE_ENCODING, 'auto', $_POST);
255         }
256
257 } else if (! empty($_POST)) {
258         // 全部まとめて、自動検出/変換
259         mb_convert_variables(SOURCE_ENCODING, 'auto', $_POST);
260 }
261
262 // 文字コード変換 ($_GET)
263 // GET method は form からの場合と、<a href="http://script/?key=value> の場合がある
264 // <a href...> の場合は、サーバーが rawurlencode しているので、コード変換は不要
265 if (isset($_GET['encode_hint']) && $_GET['encode_hint'] != '')
266 {
267         // form 経由の場合は、ブラウザがエンコードしているので、コード検出・変換が必要。
268         // encode_hint が含まれているはずなので、それを見て、コード検出した後、変換する。
269         // 理由は、post と同様
270         $encode = mb_detect_encoding($_GET['encode_hint']);
271         mb_convert_variables(SOURCE_ENCODING, $encode, $_GET);
272 }
273
274
275 /////////////////////////////////////////////////
276 // QUERY_STRINGを取得
277
278 // cmdもpluginも指定されていない場合は、QUERY_STRINGを
279 // ページ名かInterWikiNameであるとみなす
280 $arg = '';
281 if (isset($_SERVER['QUERY_STRING']) && $_SERVER['QUERY_STRING'] != '') {
282         global $g_query_string;
283         $g_query_string = $_SERVER['QUERY_STRING'];
284         $arg = & $_SERVER['QUERY_STRING'];
285 } else if (isset($_SERVER['argv']) && ! empty($_SERVER['argv'])) {
286         $arg = & $_SERVER['argv'][0];
287 }
288 if (PKWK_QUERY_STRING_MAX && strlen($arg) > PKWK_QUERY_STRING_MAX) {
289         // Something nasty attack?
290         pkwk_common_headers();
291         sleep(1);       // Fake processing, and/or process other threads
292         echo('Query string too long');
293         exit;
294 }
295 $arg = input_filter($arg); // \0 除去
296
297 // unset QUERY_STRINGs
298 foreach (array('QUERY_STRING', 'argv', 'argc') as $key) {
299         unset(${$key}, $_SERVER[$key], $HTTP_SERVER_VARS[$key]);
300 }
301 // $_SERVER['REQUEST_URI'] is used at func.php NOW
302 unset($REQUEST_URI, $HTTP_SERVER_VARS['REQUEST_URI']);
303
304 // mb_convert_variablesのバグ(?)対策: 配列で渡さないと落ちる
305 $arg = array($arg);
306 mb_convert_variables(SOURCE_ENCODING, 'auto', $arg);
307 $arg = $arg[0];
308
309 /////////////////////////////////////////////////
310 // QUERY_STRINGを分解してコード変換し、$_GET に上書き
311
312 // URI を urlencode せずに入力した場合に対処する
313 $matches = array();
314 foreach (explode('&', $arg) as $key_and_value) {
315         if (preg_match('/^([^=]+)=(.+)/', $key_and_value, $matches) &&
316             mb_detect_encoding($matches[2]) != 'ASCII') {
317                 $_GET[$matches[1]] = $matches[2];
318         }
319 }
320 unset($matches);
321
322 /////////////////////////////////////////////////
323 // GET, POST, COOKIE
324
325 $get    = & $_GET;
326 $post   = & $_POST;
327 $cookie = & $_COOKIE;
328
329 // GET + POST = $vars
330 if (empty($_POST)) {
331         $vars = & $_GET;  // Major pattern: Read-only access via GET
332 } else if (empty($_GET)) {
333         $vars = & $_POST; // Minor pattern: Write access via POST etc.
334 } else {
335         $vars = array_merge($_GET, $_POST); // Considered reliable than $_REQUEST
336 }
337
338 /**
339  * Parse specified format query_string as params.
340  *
341  * For example: ?//key1.value2//key2.value2
342  */
343 function parse_query_string_ext($query_string) {
344         $vars = array();
345         $m = null;
346         if (preg_match('#^//[^&]*#', $query_string, $m)) {
347                 foreach (explode('//', $m[0]) as $item) {
348                         $sp = explode('.', $item, 2);
349                         if (isset($sp[0])) {
350                                 if (isset($sp[1])) {
351                                         $vars[$sp[0]] = $sp[1];
352                                 } else {
353                                         $vars[$sp[0]] = '';
354                                 }
355                         }
356                 }
357         }
358         return $vars;
359 }
360 if (isset($g_query_string) && $g_query_string) {
361         if (substr($g_query_string, 0, 2) === '//') {
362                 // Parse ?//key.value//key.value format query string
363                 $vars = array_merge($vars, parse_query_string_ext($g_query_string));
364         }
365 }
366
367
368 // 入力チェック: 'cmd=' and 'plugin=' can't live together
369 if (isset($vars['cmd']) && isset($vars['plugin']))
370         die('Using both cmd= and plugin= is not allowed');
371
372 // 入力チェック: cmd, plugin の文字列は英数字以外ありえない
373 foreach(array('cmd', 'plugin') as $var) {
374         if (isset($vars[$var]) && ! preg_match('/^[a-zA-Z][a-zA-Z0-9_]*$/', $vars[$var]))
375                 unset($get[$var], $post[$var], $vars[$var]);
376 }
377
378 // 整形: page, strip_bracket()
379 if (isset($vars['page'])) {
380         $get['page'] = $post['page'] = $vars['page']  = strip_bracket($vars['page']);
381 } else {
382         $get['page'] = $post['page'] = $vars['page'] = '';
383 }
384
385 // 整形: msg, 改行を取り除く
386 if (isset($vars['msg'])) {
387         $get['msg'] = $post['msg'] = $vars['msg'] = str_replace("\r", '', $vars['msg']);
388 }
389
390 // 後方互換性 (?md5=...)
391 if (isset($get['md5']) && $get['md5'] != '' &&
392     ! isset($vars['cmd']) && ! isset($vars['plugin'])) {
393         $get['cmd'] = $post['cmd'] = $vars['cmd'] = 'md5';
394 }
395
396 // cmdもpluginも指定されていない場合は、QUERY_STRINGをページ名かInterWikiNameであるとみなす
397 if (! isset($vars['cmd']) && ! isset($vars['plugin'])) {
398
399         $get['cmd']  = $post['cmd']  = $vars['cmd']  = 'read';
400
401         $arg = preg_replace("#^([^&]*)&.*$#", "$1", $arg);
402         if ($arg == '') $arg = $defaultpage;
403         $arg = rawurldecode($arg);
404         $arg = strip_bracket($arg);
405         $arg = input_filter($arg);
406         $get['page'] = $post['page'] = $vars['page'] = $arg;
407 }
408
409 /////////////////////////////////////////////////
410 // 初期設定($WikiName,$BracketNameなど)
411 // $WikiName = '[A-Z][a-z]+(?:[A-Z][a-z]+)+';
412 // $WikiName = '\b[A-Z][a-z]+(?:[A-Z][a-z]+)+\b';
413 // $WikiName = '(?<![[:alnum:]])(?:[[:upper:]][[:lower:]]+){2,}(?![[:alnum:]])';
414 // $WikiName = '(?<!\w)(?:[A-Z][a-z]+){2,}(?!\w)';
415
416 // BugTrack/304暫定対処
417 $WikiName = '(?:[A-Z][a-z]+){2,}(?!\w)';
418
419 // $BracketName = ':?[^\s\]#&<>":]+:?';
420 $BracketName = '(?!\s):?[^\r\n\t\f\[\]<>#&":]+:?(?<!\s)';
421
422 // InterWiki
423 $InterWikiName = '(\[\[)?((?:(?!\s|:|\]\]).)+):(.+)(?(1)\]\])';
424
425 // 注釈
426 $NotePattern = '/\(\(((?:(?>(?:(?!\(\()(?!\)\)(?:[^\)]|$)).)+)|(?R))*)\)\)/x';
427
428 /////////////////////////////////////////////////
429 // 初期設定(ユーザ定義ルール読み込み)
430 require(DATA_HOME . 'rules.ini.php');
431
432 /////////////////////////////////////////////////
433 // Load HTML Entity pattern
434 // This pattern is created by 'plugin/update_entities.inc.php'
435 require(LIB_DIR . 'html_entities.php');
436
437 /////////////////////////////////////////////////
438 // 初期設定(その他のグローバル変数)
439
440 // 現在時刻
441 $now = format_date(UTIME);
442
443 // 日時置換ルールを$line_rulesに加える
444 if ($usedatetime) $line_rules += $datetime_rules;
445 unset($datetime_rules);
446
447 // フェイスマークを$line_rulesに加える
448 if ($usefacemark) $line_rules += $facemark_rules;
449 unset($facemark_rules);
450
451 // 実体参照パターンおよびシステムで使用するパターンを$line_rulesに加える
452 $line_rules = array_merge(array(
453         '&amp;(#[0-9]+|#x[0-9a-f]+|' . get_html_entity_pattern() . ');' => '&$1;',
454         "\r"          => '<br />' . "\n",       /* 行末にチルダは改行 */
455 ), $line_rules);