> ## Documentation Index
> Fetch the complete documentation index at: https://private-7c7dfe99-mintlify-8a08bda2.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> 通过我们的教程和示例数据集开始使用 ClickHouse

# 教程和示例数据集

<Tip>
  这些教程适用于任何 ClickHouse 部署方式，包括 [ClickHouse Cloud](/zh/get-started/setup/cloud)。
</Tip>

我们提供了丰富的资源，帮助您快速上手并了解 ClickHouse 的工作原理：

* 如果您需要部署并运行 ClickHouse，请查看我们的[快速入门](/zh/get-started/setup/install)
* [ClickHouse 教程](/zh/get-started/quickstarts/tutorial)会分析纽约市出租车行程数据集

此外，示例数据集也是学习 ClickHouse 的绝佳方式，
可以帮助您掌握重要的技术和技巧，并了解如何充分利用 ClickHouse 的众多强大
函数。示例数据集包括：

{/*AUTOGENERATED_START*/}

| 页面                                                                                  | 描述                                                                              |
| ----------------------------------------------------------------------------------- | ------------------------------------------------------------------------------- |
| [亚马逊客户评价](/zh/get-started/sample-datasets/amazon-reviews)                           | 超过 1.5 亿条亚马逊产品客户评价                                                              |
| [AMPLab Big Data Benchmark](/zh/get-started/sample-datasets/amplab-benchmark)       | 用于比较数据仓库解决方案性能的基准数据集。                                                           |
| [使用 ClickHouse 分析 Stack Overflow 数据](/zh/get-started/sample-datasets/stackoverflow) | 使用 ClickHouse 分析 Stack Overflow 数据                                              |
| [匿名化网站分析](/zh/get-started/sample-datasets/anon-web-analytics-metrica)               | 由两个表组成的数据集，包含匿名化的网站分析数据，表名为 hits 和 visits                                       |
| [布朗大学基准测试](/zh/get-started/sample-datasets/brown-benchmark)                         | 一项面向机器生成日志数据的新分析基准测试                                                            |
| [COVID-19 开放数据](/zh/get-started/sample-datasets/covid19)                            | COVID-19 Open-Data 是一个大型开源数据库，涵盖 COVID-19 流行病学数据以及人口统计、经济和政府应对等相关因素             |
| [DBpedia 数据集](/zh/get-started/sample-datasets/dbpedia)                              | 包含来自 Wikipedia 的 100 万篇文章及其嵌入向量的数据集                                             |
| [环境传感器数据](/zh/get-started/sample-datasets/environmental-sensors)                    | 来自 Sensor.Community 的超过 200 亿条记录的数据；该平台是一个由贡献者驱动、用于创建开放环境数据的全球传感器网络。            |
| [Foursquare 地点数据](/zh/get-started/sample-datasets/foursquare-os-places)             | 包含超过 1 亿条记录的数据集，涵盖地图上各类地点的信息，例如商店、餐厅、公园、游乐场和纪念碑。                                |
| [使用蜂窝基站数据集的 Geo data](/zh/get-started/sample-datasets/cell-towers)                  | 了解如何将 OpenCelliD 数据加载到 ClickHouse、将 Apache Superset 连接到 ClickHouse，并基于这些数据构建仪表板 |
| [GitHub 事件数据集](/zh/get-started/sample-datasets/github-events)                       | 包含 GitHub 自 2011 年至 2020 年 12 月 6 日期间所有事件的数据集，共有 31 亿条记录。                       |
| [Hacker News 数据集](/zh/get-started/sample-datasets/hacker-news)                      | 包含 2800 万行 Hacker News 数据的数据集。                                                  |
| [Hacker News 向量搜索数据集](/zh/get-started/sample-datasets/hacker-news-vector-search)    | 包含 2800 多万个 Hacker News 帖子及其嵌入向量的数据集                                            |
| [LAION 5B 数据集](/zh/get-started/sample-datasets/laion5b)                             | 包含来自 LAION 5B 数据集的 1 亿个向量的数据集                                                   |
| [Laion-400M 数据集](/zh/get-started/sample-datasets/laion)                             | 包含 4 亿张配有英文图片说明文字的图像的数据集                                                        |
| [纽约公共图书馆 "What's on the Menu?" 数据集](/zh/get-started/sample-datasets/menus)          | 包含 130 万条历史记录的数据集，收录了酒店、餐厅和咖啡馆的菜单，以及菜品及其价格。                                     |
| [纽约出租车数据](/zh/get-started/sample-datasets/nyc-taxi)                                 | 自 2009 年以来纽约市数十亿条出租车和租赁车辆 (Uber、Lyft 等) 行程数据                                    |
| [NOAA 全球历史气候网络](/zh/get-started/sample-datasets/noaa)                               | 过去 120 年的 25 亿行气候数据                                                             |
| [NYPD 投诉数据](/zh/get-started/sample-datasets/nypd-complaint-data)                    | 5 步摄取并查询制表符分隔值数据                                                                |
| [OnTime](/zh/get-started/sample-datasets/ontime)                                    | 包含航空公司航班准点率表现的数据集                                                               |
| [Star Schema Benchmark (SSB, 2009)](/zh/get-started/sample-datasets/star-schema)    | Star Schema Benchmark (SSB) 数据集及其查询                                             |
| [台湾历史天气数据集](/zh/get-started/sample-datasets/tw-weather)                             | 过去 128 年间的 1.31 亿行天气观测数据                                                        |
| [来自 Criteo 的 TB 级点击日志](/zh/get-started/sample-datasets/criteo)                      | 来自 Criteo 的 1 TB 点击日志                                                           |
| [英国房地产价格数据集](/zh/get-started/sample-datasets/uk-price-paid)                         | 了解如何使用 projections 提升常用查询的性能。该英国房地产数据集包含英格兰和威尔士的房地产成交价格数据                       |
| [TPC-DS (2012)](/zh/get-started/sample-datasets/tpcds)                              | TPC-DS 基准测试数据集及其查询。                                                             |
| [TPC-H (1999)](/zh/get-started/sample-datasets/tpch)                                | TPC-H 基准测试数据集及其查询。                                                              |
| [WikiStat](/zh/get-started/sample-datasets/wikistat)                                | 探索包含 0.5 万亿条记录的 WikiStat 数据集。                                                   |
| [使用 GitHub 数据在 ClickHouse 中编写查询](/zh/get-started/sample-datasets/github)            | 包含 ClickHouse 仓库中所有提交和变更的数据集                                                    |
| [YouTube 点踩数据集](/zh/get-started/sample-datasets/youtube-dislikes)                   | YouTube 视频点踩数据集合。                                                               |
