หน้าเว็บ

วันอาทิตย์ที่ 11 กันยายน พ.ศ. 2554

SEARCH ENGINE

Search Engine คืออะไร ?
เสิร์ชเอนจิน (search engine)    คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป
สัดส่วนของผู้ใช้ในสหรัฐอเมริกา (ข้อมูลจาก นิตยสารฟอรบส์ ฉบับวันที่ 18 กรกฎาคม พ.ศ. 2548)
1. กูเกิล (Google) 36.9%
2. ยาฮูเสิร์ช (Yahoo! Search) 30.4%
3. เอ็มเอสเอ็นเสิร์ช (MSN Search) 15.7%




Search Engine มีกี่ประเภท

Search Engine มี 3 ประเภท (ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล ผมสรุปได้ 3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง 3 ประเภทหลัก ๆ


ประเภทที่ 1 Crawler Based Search Engines

Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ

1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง
http://www.google.com






Crawler Based Search Engine ได้แก่อะไรบ้าง

ตัวอย่าง Google , Yahoo, MSN, Live, Search, Technorati  ส่วนลักษณะการทำงาน และ การเก็บข้อมูลของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกัน เช่น การค้นหาคำว่า Search Engine คืออะไรผ่านทั้ง 5 แห่ง  จะได้ผลการค้นหาที่ต่างกัน


ประเภทที่ 2 Web Directory หรือ Blog Directory

Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลือง  ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ขอยกตัวอย่างดังนี้



 
ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory 

    1.ODP หรือ Dmoz ที่หลาย ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วย (URL : http://www.dmoz.org )

    2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )

   3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้



ประเภทที่ 3 Meta Search Engine

Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ

ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร


ประโยชน์ของการ  search ข้อมูล

        1. ค้นหาเว็บที่ต้องการได้สะดวก รวดเร็ว
        2. สามารถค้นหาแบบเจาะลึกได้ ไม่ว่าจะเป็น รูปภาพ, ข่าว, MP3 และอื่นๆ อีกมากมาย
        3. สามารถค้นหาจากเว็บไซต์เฉพาะทาง ที่มีการจัดทำไว้ เช่น download.com เว็บไซต์เกี่ยวกับ

            ข้อมูลและซอร์ฟแวร์ เป็นต้น
        4. มีความหลากหลายในการค้นหาข้อมูล
        5. รองรับการค้นหา ภาษาไทย




สถิติการใช้ web ที่มีการทำงานในระบบของ search engine ในปัจจุบัน





ข้อควรระวังในการใช้ Search Engine


     1. ละเลยการใช้ Alt ในรูปภาพ – เนื่องจาก Search Engine ไม่ได้เก็บข้อมูลในรูปแบบเว็บเพจ อย่างเดียวเท่านั้น บริการค้นหารูปภาพของ Google ก็เป็นอีกช่องทางหนึ่งที่จะนำลูกค้ามาให้คุณได้เช่นกัน การใช้งาน Alt นอกจากจะทำให้รูปภาพสินค้า หรือบริการของคุณ ปรากฏต่อหน้าผู้ค้นหาแล้ว ยังช่วยเพิ่ม Keyword ให้กับเว็บเพจของคุณได้

     2. URL ที่ไม่เป็นมิตรกับ Search Engine – ในปัจจุบัน Platform เว็บไซต์สำเร็จรูปจะมี Feature URL Friendly เป็นพื้นฐานอยู่แล้ว แต่เว็บไซต์ที่มีการพัฒนาโดยผู้พัฒนาที่ไม่คำนึงทำการทำ SEO อาจจะพลาดในสิ่งนี้ไปนี่คือตัวอย่างของ Friendly และ Non-Friendly URL

    3. การเปลี่ยน Theme หรือการ Redesign เว็บไซต์ – ในหลายๆ ครั้งเราจะเห็นว่าผู้ออกแบบและพัฒนาเว็บไซต์ จะ Redirect ผู้เยี่ยมชมไปที่ example.com/v2 เพื่อให้ผู้ใช้งานเข้าเยี่ยมชมเว็บไซต์ ที่มีการเปลี่ยนแปลงไม่ว่าจะเป็น Theme หรือ Layout ของเว็บไซต์ ซึ่งตรงนี้จะทำให้ Robot เกิดการสับสนว่า หน้าแรกของเว็บไซต์ คือ URL ไหน และอาจก่อให้เกิดปัญหา Duplicate Content ได้
 

วันอาทิตย์ที่ 4 กันยายน พ.ศ. 2554

พ.ร.บ. ว่าด้วยการกระทำผิดเกี่ยวกับคอมพิวเตอร์ พ.ศ. 2550

                    พระราชบัญญัติฉบับนี้ประกาศเมื่อวันที่ 18 มิถุนายน 2550 และมีผลบังคับใช้ตั้งแต่
วันที่ 18 กรกฎาคม 2550 เป็นต้นไป   การที่มี พ.ร.บ. คอมพิวเตอร์ขึ้นมาเพื่อไม่ให้ผู้ใช้คอมพิวเตอร์กระทำการใดๆ ที่ส่งผลต่อบุคคล ประชาชน  สังคม  จึงต้องมีความควบคุมเกี่ยวกับการใช้คอมพิวเตอร์

                    การกระทำความผิดที่เข้าข่าย พ.ร.บ. คอมพิวเตอร์
           1.  การเข้าถึงข้อมูลของบุคคลอื่นโดยไม่ได้รับอนุญาต
           2.  การทำความเสียหาย  ทำลาย  แก้ไข  เปลี่ยนแปลง  ข้อมูลของผู้อื่นโดยมิชอบ
           3.  การทำลายระบบของผู้อื่นเพื่อให้ผู้อื่นไม่สามารถเข้าใช้งานได้ตามปกติ
           4.  การส่งข้อมูลเพื่อรบกวนการทำงานของผู้อื่น
           5.  การจำหน่ายชุดคำสั่งเพื่อใช้ในการกะรทำความผิด
 
                   ผู้ที่เกี่ยวข้องกับพ.ร.บ. คอมพิวเตอร์
           1.  ผู้ที่ประกอบกิจการโทรคมนาคมไม่ว่าโดยระบบโทรศัพท์  ระบบดาวเทียม  ระบบวงจรเช่าหรือบริการสื่อไร้สายต่าง ๆ
           2.  ผู้ให้เช่าบริการระบบคอมพิวเตอร์หรือให้เช่าบริการโปรแกรมประยุกต์ (Host  Service  Provider)
           3.  ผู้ใช้บริการข้อมูลคอมพิวเตอร์ผ่านทาง  Application  ต่างๆ

                  ผู้ให้บริการทั้งที่เสียค่าบริการหรือไม่ก็ตาม  ต้องเก็บข้องมูลเท่าที่จำเป็น  เพื่อที่จะสามารถระบุตัวผู้ใช้บริการได้  ไม่ว่าจะเป็น  USERNAME  หรือ PIN CODE  ไว้ไม่น้อยกว่า  90  วัน  นับตั้งแต่การใช้บริการสิ้นสุดลง  หากผู้ให้บริการไม่เก็บข้อมูลของผู้ใช้บริการไว้ถือว่ากระทำความผิดและอาจถูกปรับสูงถึง 500,000  บาท

                 พ.ร.บ. นี้จะมีผลกระทบกับผู้ใช้คอมพิวเตอร์อินเตอร์เน็ตโดยทั่วไป  เพราะหากท่านทำให้เกิดการกระทำความผิดทางคอมพิวเตอร์(ไม่ว่าจะตั้งใจหรือไม่ก็ตาม) ก็อาจมีผลต่อตัวท่านเอง  ที่สำคัญคือผู้ให้บริการซึ่งรวมไปถึงหน่วยงานต่าง ๆ ที่เปิดบริการอินเตอร์เน็ตให้แก่ผู้อื่น ต้องดูแลรับผิดชอบอย่างรอบคอบในฐานะ "ผู้ให้บริการ"

                ข้อควรปฏิบัติในการใช้คอมพิวเตอร์และอินเตอร์เน็ต

          1.  ไม่ควรบอก Password  แก่ผู้อื่น
          2.  อย่าให้ผู้อื่นยืมใช้คอมพิวเตอร์หรือโทรศัพท์เคลื่อนที่เพื่อเข้าเน็ต
          3.  อย่าติดตั้งระบบเครือข่ายไร้สายในบ้ารหรือที่ทำงานโดยไม่มีมาตรการการตรวจสอบผู้ใช้งานและเข้ารหัสลับ
          4.  อย่าเข้าสู่ระบบด้วย  USER  ID  และPASSWORD  ที่ไม่ใช่ของท่านเอง
          5.  อย่านำ USER  ID  และ  PASSWORD  ของผุ้อื่นไปใช้ง่านหรือเผยแพร่
          6.  อย่าส่งต่อภาพหรือข้อความที่ผิดกฏหมาย
          7.  อย่ากด " Remember me"  หรือ  "Remember  password"  ที่เครื่องคอมพิวเตอร์สาธารณะ และอย่า  Log-in เพื่อทำธุรกรรมทางการเงินที่เครื่องสาธารณะ
          8.  อย่าใช้  Wifi  ,Wireless  LAN  ที่เปิดให้ใช้ฟรีโดยปราศจากการเข้ารหัสลับข้อมูล


                       การกระทำผิดทางอาญาตาม  พ.ร.บ.  คอมพิวเตอร์
          1.  เจ้าของไม่ให้เข้าระบบคอมพิวเตอร์แล้วยังแอบเข้าไป
                     จำคุก  6  เดือน  หรือปรับไม่เกิน  10,000  บาท  หรือทั้งจำทั้งปรับ
          2.  รู้วิธีการเข้าระบบคอมพิวเตอร์ของผู้อื่นแล้วบอกต่อ
                  จำคุกไม่เกิน  1  ปี  หรือปรับไม่เกิน  20,000  บาท  หรือทั้งจำทั้งปรับ
          3.  แอบไปเจาะข้อมูลของผู้อื่นที่เก็บไว้ในระบบคอมพิวเตอร์
                  จำคุกไม่เกิน  2  ปี  หรือปรับไม่เกิน  40,000  บาท  หรือทั้งจำทั้งปรับ
          4.  ดักจับข้อมูลของผู้อื่นระหว่างการสื่อสารผ่านเครือข่ายอินเตอร์เน็ต
                 จำคุกไม่เกิน  3  ปี  หรือปรับไม่เกิน  60,000  บาท  หรือทั้งจำทั้งปรับ
          5.  ไปแก้ไขข้อมูลในระบบคอมพิวเตอร์ของผู้อื่น
                 จำคุกไม่เกิน  5  ปี  หรือปรับไม่เกิน  100,000  บาท  หรือทั้งจำทั้งปรับ
          6.  ส่ง  packer  หรือ  message  หรือ  virus  หรือ  trojan  หรือ  worm หรืออะไรก็ตามเข้าไปก่อกวนระบบผู้อื่น
                 จำคุกไม่เกิน  5  ปี  หรือปรับไม่เกิน  100,000  บาท  หรือทั้งจำทั้งปรับ
          7.  ส่งข้อมูลหรือ E-Mail  ให้ผู้อื่นซ้ำ ๆ โดยที่ผู้รับไม่ได้ร้องขอ
                 ปรับไม่เกิน  100,000  บาท
          8.  ความผิดร่วม  ข้อ5  กับข้อ 6 ทำให้บุคคลทั่วไปเกิดความเสียหาย
                 จำคุกไม่เกิน  10  ปี  และปรับไม่เกิน  200,000 บาท
               หากก่อความเสียหายต่อความมั่นคงของประเทศ  เศรษฐกิจ  และสังคม
                 จำคุกตั้งแต่  3-5  ปี  และปรับตั้งแต่  60,000 - 300,000  บาท
          9.  ถ้าเป็นผูผลิตซอฟต์แวร์เพื่อทำการกระทำความผิดข้างต้นหลายข้อ
                 จำคุกไม่เกิน  1  ปี  หรือปรับไม่เกิน  20,000  บาท  หรือทั้งจำทั้งปรับ
         10.  สร้างภาพโป๊  เรื่องเท็จ  ทำการปลอมแปลง  กระทำการใดๆ  ที่กระทบความมั่นคง  ก่อการร้าย  และส่งต่อข้อมูลทั้ง ๆ ที่รู้ว่าผิดตามที่กล่าวมาข้างต้น
                  จำคุกไม่เกิน  5  ปี  หรือปรับไม่เกิน  100,000  บาท  หรือทั้งจำทั้งปรับ
         11.  เจ้าของเว็บ สนับสนุน / ยินยอมให้เกิดข้อ 10.
                  จำคุกไม่เกิน  5  ปี  หรือปรับไม่เกิน  100,000  บาท  หรือทั้งจำทั้งปรับ
         12.  เอารูปบุคคลอื่นมาตัดต่อแล้วเอาไปเผยแพร่ในระบบคอมพิวเตอร์
                  จำคุกไม่เกิน  3  ปี  หรือปรับไม่เกิน  60,000  บาท  หรือทั้งจำทั้งปรับ