Go home




WebCaptorとは

インストール方法

WebCaptorの使い方

環境設定

巡回先の設定

巡回

閲覧と表示








Vector
Get Microsoft Internet Explorer
巡回先を設定する

巡回先のURLを設定する

巡回を実行するには、まず巡回したいホームページのURLや巡回の条件などの情報をスケジュールに登録します。

巡回先の情報としてほとんどの項目には、デフォルト値が設定されているため、必ずしも全て入力する必要はありませんが、最低限、巡回先のURLは指定する必要があります。

巡回先のURLは、「巡回先の追加」及び「巡回先の変更」ダイアログの[項目]タブで設定します。

新規に巡回先のURLを登録する際には、「巡回先の追加」ダイアログのURL欄に直接手入力する方法の他に、次の二つ方法で簡単に追加登録が出来ます。

●表示中のブラウザ、又はクリップボードから取り込む。

「巡回先の追加」ダイアログを表示する際にブラウザに表示しているページのURL、又はクリップボードからURLを取得できます。
まず、登録したいURLのホームページを内蔵ブラウザ、又は外部ブラウザに表示しておきます。次に「巡回先の追加」ダイアログを表示するとURL欄に表示中のURLがコピーされます。表示中のブラウザに有効なURL(http://〜)がない場合には、クリップボードからコピーされます。
内蔵ブラウザと外部ブラウザ及びクリップボードのいずれにも有効なURLが存在する場合は、次の優先順位でURLを取得します。

内蔵ブラウザ > 外部ブラウザ > クリップボード

また、外部ブラウザが複数表示されている場合は、最前面の外部ブラウザが取得対象になります。

●ブラウザに表示されているリンクをドラッグ&ドロップで追加登録する。

内蔵ブラウザ、及び、外部ブラウザなど他のアプリケーションからドラッグ&ドロップで巡回先の追加ができます。
まず、登録したいURLのリンクを含むホームページを内蔵ブラウザ、又は外部ブラウザに表示します。次に登録したいリンクをドラッグしてリンクツリーにドロップします。スケジュールにリンクのURLが追加登録され、リンクツリーの最後尾に表示されます。巡回先のURLと名称(タイトル)以外の項目は、デフォルト値が設定されます。


巡回の種類と範囲を設定する

巡回によるデータを取り込みは、指定されたページを基点にして、リンクを追跡しながら行います。

指定されたホームページが大規模な場合や、他のホームページへのリンクを多く含む場合などは、意図しないページを多く含んだり、データが膨大になって期待した取り込みが出来いことがあります。

このような場合には、巡回する範囲や取り込むリンクの種類、ファイルタイプなどを指定してターゲットを絞り込むことで、効率的な取り込みが出来ます。

巡回の範囲や種類などは、「巡回先の追加」「巡回先の変更」ダイアログの[範囲]タブ で指定します。


●巡回範囲を指定する

巡回の範囲は、次の項目で指定します。

・巡回レベル、個別巡回レベル
巡回先として指定されたURLのページを基点として、取り込むページののリンク階層の深さを指定します。

・外部ドメイン
巡回先として指定したURLのドメイン以外のドメインを巡回するかどうか指定します。
外部ドメインを巡回しない指定をすると巡回先として指定したホームページだけを取り込みます。

・上位リンク
巡回先として指定したURLより上位のディレクトリ階層にあるリンクを巡回するかどうか指定できます。
上位リンクを巡回しない指定をすることで、取り込みたいホームページの一部分だけ取り込むことができます。


●リンクの種類を指定する

リンクの種類は、次の項目で指定できます。

・CGIリンク
サーバーがCGIで動的に作成するページを取り込むかどうか指定します。
CGIリンクを取り込まない指定をすることで、サーバーが動的に作成するページを取り込まないようにします。

・FTPリンク
リンクのURLが"ftp://〜"のようなFTPリンクの場合に取り込むかどうか指定します。
FTPリンクを取り込まない指定をすることで、FTPサーバーからの取り込みをしないようにします。


●サイズを指定する

取り込むコンテンツのサイズを指定します。

大きなファイルは取り込みたくないような場合にファイルサイズを指定することで、指定サイズ以上のコンテンツを取り込まないようにします。


●ファイル・タイプを指定する

ファイル・タイプ(拡張子)で取り込むデータの種類を指定できます。

ファイル・タイプは次の種類に分類されています。

  • HTMLドキュメント
  • イメージ
  • サウンド
  • ムービー
  • 実行ファイル
  • スクリプト
  • ActiveX
  • その他

種類の内訳は、ユーザーが変更できます。
ファイル・タイプを指定することで不要なコンテンツを取り込まないようにします。

アクセス・モード

定期的にホームページを巡回して最新のデータを取得したいような場合は、更新されているデータだけを取り込めれば、効率的な巡回が出来ます。

アクセス・モードの指定で、更新されているデータ、又は有効期限の切れているデータだけを取り込むように出来ます。

アクセス・モードとして、次の指定ができます。

・すべて読み込む
更新の有無に関わらず、すべて取り込みます。

・取り込み済みなら読み込まない
既に取り込まれているならデータなら、取り込みません。

・更新日をチェックして読み込む (既定値)
更新日をチェックして、更新されているデータなら取り込みます。

・有効期限をチェックして読み込む
有効期限をチェックして、有効期限が切れているデータなら取り込みます。


巡回除外リンク

巡回によるデータを取り込みは、巡回先として指定されたページ(URL)からリンクを追跡することで行います。このとき特定のURLを指定してデータの取り込みとリンクの追跡を行なわないようにすることが出来ます。

巡回除外リンクは、「巡回先の追加」「巡回先の変更」ダイアログの[除外リンク]タブでURLを指定するか、又はリンクツリーで表示されるリンクを除外チェックして指定します。

●リンクツリーで巡回除外リンクを指定する

リンクツリーを使うと巡回除外リンクの指定を簡単に行えます。

方法は、除外したいリンクのチェックボックスをシフトキーを押しながらクリックするだけです。
リンクが除外指定されるとチェックボックスに赤色のチェックマークが付きます。チェックマークは、指定されたリンクと同じURLの全てのリンクに付きます。

除外リンクの指定を解除するには、赤色チェックマークの付いたリンクを、再度、シフトキーを押しながらクリックします。クリックしたリンクと同じURLの全てのリンクの赤色チェックマークが消え、巡回除外リンクの指定が解除されます。


●巡回除外リンクのURLを手入力で指定する

「巡回先の追加」「巡回先の変更」ダイアログの[除外リンク]タブで巡回除外リンクのURLを手入力で編集しながら指定することもできます。また、[除外リンク]タブでは、リンクツリーでの指定を含む、巡回除外リンクのURLを一覧することが出来ます。

ここで入力、編集されたURLは、リンクツリーに反映されます。



Go top