正規表現で、とにかく http で始まる URL らしきものの取得

  VS2010(C#)



using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using System.Text.RegularExpressions;
using System.IO;

namespace RegexTest {
	class Program {
		static void Main(string[] args) {

			// インターネットアクセス
			WebClient client = new WebClient();
			client.Encoding = Encoding.UTF8;
			//client.Encoding = Encoding.GetEncoding("shift_jis");
			//client.Encoding = Encoding.GetEncoding("euc-jp");
			string result = client.DownloadString("http://gigazine.net/");

			// 書き込み用テキストファイルの準備
			FileStream fs = new FileStream("result.txt",FileMode.Create,FileAccess.Write);
			StreamWriter sw = new StreamWriter(fs,Encoding.GetEncoding("shift_jis"));

			sw.WriteLine("SHIFT_JIS で書き込んでいます");

			MatchCollection mc = Regex.Matches(result, "(https?://.+?)[\"']?[;)>\\s]");
			foreach (Match match in mc) {
				sw.WriteLine( match.Groups[1] );
			}

			sw.Close();
			sw.Dispose();
			fs.Close();
			fs.Dispose();

		}
	}
}











  infoboard   管理者用   
このエントリーをはてなブックマークに追加





フリーフォントWEBサービス
SQLの窓WEBサービス

SQLの窓フリーソフト

素材

一般WEBツールリンク

SQLの窓

フリーソフト

JSライブラリ