Search results
Jump to navigation
Jump to search
Page title matches
- ## Hadoop Distributed File System (HDFS) ...ý lượng lớn dữ liệu trên các cụm hàng hóa. Đây là thành phần cốt lõi của [[Hadoop]], một framework mã nguồn mở để xử lý dữ liệu lớn. Bài ...12 KB (2,789 words) - 05:18, 24 April 2025
Page text matches
- === 1. Hadoop === [[Hadoop]] là một Framework mã nguồn mở được thiết kế để lưu tr� ...12 KB (2,856 words) - 09:32, 22 April 2025
- ## Hadoop Distributed File System (HDFS) ...ý lượng lớn dữ liệu trên các cụm hàng hóa. Đây là thành phần cốt lõi của [[Hadoop]], một framework mã nguồn mở để xử lý dữ liệu lớn. Bài ...12 KB (2,789 words) - 05:18, 24 April 2025
- ...iệu nhanh chóng và mạnh mẽ. [[Hive]] là một kho dữ liệu được xây dựng trên Hadoop, cho phép người dùng truy vấn dữ liệu bằng ngôn ngữ SQL. ...ne truy vấn SQL hiệu suất cao cho Hadoop. [[Hue]] là một giao diện web cho Hadoop. ...13 KB (3,055 words) - 09:28, 22 April 2025
- ...lý cơ sở dữ liệu phù hợp (ví dụ: [[MySQL]], [[PostgreSQL]], [[MongoDB]], [[Hadoop]]). ...Xử lý và lưu trữ các bộ dữ liệu lớn bằng cách sử dụng các công nghệ như [[Hadoop]], [[Spark]], và [[Kafka]]. ...12 KB (2,724 words) - 11:22, 23 April 2025
- * **Hadoop Security:** Hadoop cung cấp các tính năng bảo mật như xác thực Kerberos, ủy quy ...**Spark Security:** Spark cũng cung cấp các tính năng bảo mật tương tự như Hadoop. ...13 KB (3,199 words) - 13:12, 23 April 2025
- ...h. [[Hadoop Distributed File System]] (HDFS) là hệ thống tệp phân tán của Hadoop. ...engine xử lý dữ liệu nhanh chóng và mạnh mẽ, thường được sử dụng cùng với Hadoop. Spark cung cấp API cho Python, R, Scala và Java. Nó đặc biệt hi ...13 KB (3,246 words) - 15:51, 23 April 2025
- * **Kỹ năng:** Các kỹ năng chuyên môn như [[Python]], [[R]], [[SQL]], [[Hadoop]], [[Spark]], [[TensorFlow]], [[Keras]], [[PyTorch]], và [[Tableau]] đề * **Big Data Technologies (Hadoop, Spark):** Kinh nghiệm với các công nghệ Big Data có thể tăng m ...11 KB (2,485 words) - 15:43, 23 April 2025
- ...Một mô hình lập trình để xử lý các tập dữ liệu lớn một cách song song. [[Hadoop]] là một triển khai phổ biến của MapReduce. * '''Apache Hadoop:''' Một nền tảng mã nguồn mở để lưu trữ và xử lý các ...13 KB (3,125 words) - 21:03, 6 May 2025
- * **Hadoop:** Một framework mã nguồn mở cho phép lưu trữ và xử lý dữ * **Spark:** Một công cụ xử lý dữ liệu nhanh hơn Hadoop, đặc biệt phù hợp với các ứng dụng thời gian thực. ...12 KB (2,950 words) - 16:45, 6 May 2025
- ...iệu lớn:''' Xử lý các bộ dữ liệu lớn bằng cách sử dụng các công nghệ như [[Hadoop]] và [[Spark]]. * [[Hadoop]] ...13 KB (3,104 words) - 18:20, 23 April 2025
- * **Hadoop:** Một framework mã nguồn mở để lưu trữ và xử lý các bộ * **Spark:** Một engine xử lý dữ liệu nhanh hơn Hadoop, phù hợp cho các tác vụ phân tích thời gian thực. ...11 KB (2,600 words) - 20:52, 6 May 2025
- ...' Đây là nơi dữ liệu được lưu trữ. Các hệ thống lưu trữ phổ biến bao gồm [[Hadoop Distributed File System (HDFS)]], [[Amazon S3]], [[Azure Data Lake Storage] * '''Hadoop:''' Một framework mã nguồn mở để lưu trữ và xử lý dữ li� ...12 KB (2,824 words) - 20:26, 6 May 2025
- * **Hadoop:** Một framework mã nguồn mở cho phép lưu trữ và xử lý dữ * **Spark:** Một engine xử lý dữ liệu nhanh hơn Hadoop, đặc biệt phù hợp với các tác vụ phân tích thời gian th� ...12 KB (2,919 words) - 09:22, 22 April 2025
- ...vào việc sử dụng các công cụ và nền tảng Big Data cụ thể, chẳng hạn như [[Hadoop]], [[Spark]], [[Kafka]] hoặc [[Tableau]]. [[Hadoop]] ...13 KB (3,013 words) - 09:31, 22 April 2025
- ...khoa học dữ liệu khám phá dữ liệu và thực hiện các phân tích nâng cao. [[Hadoop]] và [[Spark]] là các công nghệ phổ biến được sử dụng tro * **Xử lý dữ liệu lớn:** Hadoop, Spark, Kafka ...12 KB (2,918 words) - 12:19, 23 April 2025
- ...ình phổ biến trong Khoa học Dữ liệu bao gồm: [[Python]], [[R]], [[SQL]], [[Hadoop]], [[Spark]], và các nền tảng [[Cloud Computing]] như [[AWS]], [[Azu [[Hadoop]] ...13 KB (3,028 words) - 13:18, 23 April 2025
- ...trữ Dữ liệu Phân tán:** Sử dụng các hệ thống lưu trữ dữ liệu phân tán, như Hadoop hoặc Spark, để lưu trữ và xử lý lượng lớn dữ liệu. * **Hadoop:** Nền tảng xử lý dữ liệu phân tán. ...14 KB (3,475 words) - 12:23, 23 April 2025
- ...xử lý dữ liệu lớn, cho phép xử lý và phân tích các bộ dữ liệu khổng lồ. [[Hadoop]] và [[Spark]] thường được sử dụng trong các ứng dụng Khoa ...15 KB (3,499 words) - 14:09, 23 April 2025
- ...c cho các nhà khoa học dữ liệu. Họ thường làm việc với các công nghệ như [[Hadoop]], [[Spark]], và [[SQL]]. * **Big Data:** [[Hadoop]], [[Spark]], [[NoSQL]]. ...14 KB (3,236 words) - 15:13, 23 April 2025
- ...tán. [[Hadoop Distributed File System (HDFS)]] là thành phần cốt lõi của Hadoop, cung cấp khả năng lưu trữ dữ liệu đáng tin cậy và có kh� * **Spark:** Một engine xử lý dữ liệu nhanh hơn Hadoop, đặc biệt phù hợp cho các tác vụ phân tích dữ liệu tươn ...38 KB (6,584 words) - 21:10, 6 May 2025