Mời các bạn cùng tham khảo nội dung bài giảng Bài 1: Thông tin và xử lí thông tin bằng máy tính điện tử sau đây để tìm hiểu về khái niệm thông tin và dữ liệu, đơn vị đo thông tin, phân loại và mã hoá thông tin, khái niệm tin học và công nghệ thông tin.
Tóm tắt lý thuyết
1. Khái niệm thông tin và dữ liệu
Thông tin là những gì đem lại sự hiểu biết, nhận thức cho con người về các sự vật, hiện tượng trong đời sống tự nhiên và xã hội. Con người có thể thu nhận thông tin thông qua nhiều phương thức khác nhau như: học tập, trao đồi, nghiên cứu, đọc báo, xem ti vi, tham quan,... Khi tiếp nhận thông tin, con người phải xử lí thông tin để tạo ra các quyết định phù hợp. Chẳng hạn, mọi người thường xuyên xem chương trình dự báo thời tiết, để biết thông tin dự đoán về tình hình thời tiết của ngày hôm sau nhằm đưa ra các quyết định hợp lí như: mang theo áo mưa trước khi ra khỏi nhà đề phòng đi đường gặp trời mưa, hay mang theo áo mũ để chống nắng, hay không ra khỏi nhà khi thời tiết có khả năng xuất hiện lốc, băo lớn,... Như vậy, thông tin làm tăng thêm hiểu biết của con người, là cơ sở để con người đưa ra quyết dinh.
Thông tin tồn tại một cách khách quan và được thể hiện dưới nhiều dạng thức khác nhau như văn bản, phim ảnh, băng đĩa, hình ảnh trực quan,... Thông tin cũng có thể dược truyền tải qua các môi trường vật lí như ánh sáng, sóng âm, sóng điện từ,... Các vật mang thông tin được gọi là giá mang tin. Thông tin cũng có thể được lưu trữ, cập nhật, phát sinh và cũng có thể bị sai lệch, xuyên tạc, nhiễu do tác động của con người. Để máy tính có thể nhận biết, lưu trữ và xử lí thông tin, con người cần phải tìm ra cách thức biểu diễn mới của thông tin. Dữ liệu là hình thức biểu diễn thông tin và được thể hiện bằng các tín hiệu vật lí trong máy tính điện tử (MTĐT).
2. Đơn vị đo thông tin
Mỗi sự vật hay sự kiện đều hàm chứa một lượng thông tin. Con người khi muốn nhận biết một đối tượng cần phải có một lượng thông tin nhất định về nó. Đối với máy tính cũng vậy, để có thể nhận biết được một đối tượng, con người cũng cần phải cung cấp cho máy tính đủ lượng thông tin về đổi tượng này.
Trong máy tính, thông tin về các đối tượng được lưu trữ bởi các bit nhớ của bộ nhớ máy tính. Bit là đơn vị nhớ nhỏ nhất của bộ nhớ, một bit chỉ có thể chứa một trong hai giá trị 0 hoặc 1. Như vậy bit vừa là một khái niệm chỉ độ đo vừa chỉ một kí hiệu hoặc 0 hoặc 1. Lượng thông tin chứa trong một bit vừa đù để xác định chắc chắn một trạng thái của đổi tượng.
Trong thực tế, thông tin về một đối tượrtg cần phải có các đơn vị đo lớn hơn bit. Đơn vị đo thông dụng nhất trong máy tính là byte. Một byte được tạo thành bởi một dãy gồm 8 bit liên tiếp. Để đo các lượng thông tin lớn, người ta dùng một số đơn vị bội của byte như trong bảng 1.1 dưới đây:
Bảng 1.1. Các dơn vị đo thông tin
Kí hiệu |
Tên gọi |
Giá trị |
KB |
KiloByte |
1024 byte |
MB |
MegaByte |
1024 KB |
GB |
GigaByte |
1024 MB |
TB |
TetraByte |
1024 GB |
PB |
PetaByte |
1024 TB |
3. Phân loại và mã hoá thông tin
Có nhiều cách phân loại thông tin tuỳ thuộc vào các tiêu chuẩn khác nhau. Dựa vào các đặc tính liên tục hay rời rạc của tín hiệu vật lí thể hiện thông tin mà nó được chia thành hai loại: thông tin liên tục và thông tin rời rạc.
- Thông tin liên tục đặc trưng cho đại lượng mà số lượng các giá trị có thể tiếp nhận được là vô hạn như dộ dài dịch chuyển cơ học, điện áp,...
- Thông tin rời rạc đặc trưng cho các đại lượng mà số lượng các giá trị có thể liệt kê được như sổ chữ số trong số điện thoại, số giáo viên trong một trường học, tcn một tỉnh thành của quốc gia,...
Muốn máy tính có thể xử lí được, các thông tin liên tục hay thông tin rời rạc đều phải được biến đổi thành một dãy bit. Quá trình biến đổi này được gọi là quá trình mã hoá thông tin thành dữ liệu. Tuỳ thuộc vào đặc điểm của thông tin mà có thể sử dụng các phương pháp mã hoá khác nhau. Ví dụ, mã hoá thông tin dạng văn bản. Mỗi văn bản là một dãy các kí tự viết liên tiếp theo những quy tắc nào đó. Các kí tự bao gồm các chữ cái thường và chữ cái in hoa như a, b, c,..., Z, A, B, c,..., z, các chữ số trong hệ thập phân 0, 1, 2,..., 9 và một số kí hiệu khác như các kí tự đặc biệt @, #, !, $, %, A,..., các dấu ngắt câu,...
Để mã hoá thông tin dạng văn bản người ta chỉ cần mã hoá các kí tự. Bộ mã cơ bản mà các thế hệ máy tính ngày nay dùng để mã hoá các kí tự là bảng mã ASCII (American Standard Code for Information Interchange - Mã chuẩn của Mỹ dùng trong trao đổi thông tin). Bộ mã này sử dụng 8 bit để mã hoá kí tự. Trong đó, các kí tự được đánh số từ 0 tới 255 và các số hiệu này được gọi là mã ASCII thập phân của kí tự. Nếu kí tự có mã ASCII thập phân là N, thỉ dãy 8 bit biểu diễn dạng nhị phân của N chính là mâ hoá kí tự đó trong máy tính.
Ví dụ, kí tự “A” có mã ASCII thập phân là 65. Số 65 trong hệ thập phân được biểu diễn bởi số 01000001 trong hệ nhị phân. Vậy dãy 8 bit 01000001 chính là dữ liệu biểu diễn kí tự “A” trong máy tính. Một số mã kí tự thông dụng được cho trong phụ lục 1.
4. Khái niệm tin học và công nghệ thông tin
Tin học là ngành khoa học có mục tiêu phát triển và sử dụng MTĐT để nghiên cứu cấu trúc, tính chất của thông tin, phương pháp thu thập, lưu trữ, tìm kiếm, biến đổi, truyền thông tin và ứng dụng vào các lĩnh vực khác nhau của đời sống xã hội. Tin học gồm hai lĩnh vực:
- Phần cứng (hardware): gồm các đối tượng vật lí hữu hình như màn hình, bàn phím, vi mạch, vi xử lí, bộ nhớ, máy in, thiết bị kết nối mạng,... Phân cứng thực hiện các chức năng xử lí thông tin cơ bản ở mức thấp nhất, tức là xử lí các tín hiệu nhị phân (bit 0, 1). Mục đích nghiên cứu, phát triển của lĩnh vực phần cứng là: nâng cao tốc độ xử lí, tăng khả năng lưu trữ, tăng độ tin cậy, giảm năng lượng sử dụng, tăng khả năng ghép nối,...
- Phần mềm (software): gồm các chương trình điều khiển các hoạt động phần cứng máy tính để thực hiện chức năng xử lí thông tin. Mục đích của lĩnh vực phần mềm là tìm ra các phương pháp tổ chức dữ liệu phù hợp với chương trình xử lí thông tin, tìm ra các phương pháp xử lí thông tin hiệu quả, nhanh chóng, chính xác,... hỗ trợ con người trong các hoạt động học tập, nghiên cứu, làm việc, giải trí,,., ngày càng tốt hơn.
Khái niệm Công nghệ thông tin (CNTT - Information Technology) là một nhánh của ngành kĩ thuật sử dụng máy tính và phần mềm máy tính để chuyển đổi, lưu trữ, bảo vệ, xử lí, truyền tải và thu thập thông tin. Ở Việt Nam, khái niệm CNTT được hiểu và định nghĩa trong nghị quyết 49/CP của Chính phủ kí ngày 04/08/1993 như sau: “CNTT là tập hợp các phương pháp khoa học, các phương tiện và công cụ, kĩ thuật hiện đại - chủ yếu là kĩ thuật máy tính và viễn thông - nhằm tổ chức, khai thác và sử dụng có hiệu quả nguồn tài nguyên thông tin rất phong phú và tiềm tàng trong mọi lĩnh vực hoạt động của con người và xã hội...”
Các lĩnh vực chính của CNTT bao gồm quá trình tiếp thu, xử lí, lưu trữ và phô biến hoá âm thanh, phim ảnh, văn bản và thông tin số bởi các vi điện tử dựa trên sự kết hợp giữa máy tính và truyền thông. Một vài lĩnh vực nôi bật hiện nay của CNTT như: phát triển các tiêu chuân web thế hệ tiếp theo, hệ thổng thông tin toàn cầu, tin sinh học, điện toán dám mây, trí tuệ nhân tạo,...