中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
阿里云大佬叮囑我務(wù)必要科普這個(gè) Elasticsearch API

上截圖是阿里云魏子珺大佬(阿里巴巴集團(tuán)技術(shù)專家)周一叮囑我的。

魏子珺大佬的早期分享參考:

2021 年 Elasticsearch 生態(tài)和技術(shù)峰會(huì)干貨總結(jié)

1、啥 API 這么重要,阿里大佬要親自叮囑?

There’s a new API that supports analyzing the disk usage of each field of an index, including the entire index itself. The API estimates the disk usage of a field by iterating over its content and tracking the number of bytes read
https://www.elastic.co/guide/en/elasticsearch/reference/7.15/release-highlights.html#_index_disk_usage_api
POST kibana_sample_data_ecommerce/_disk_usage?run_expensive_tasks=true

用途:

  • 第一:支持統(tǒng)計(jì)索引自身的磁盤使用。
  • 第二:支持統(tǒng)計(jì)每個(gè)字段級(jí)別的磁盤使用。

2、_disk_usage API 適用場(chǎng)景是啥?

此 API 不支持在以前的 Elasticsearch 版本中創(chuàng)建的索引。

適用于大索引。

PS:小索引的結(jié)果可能不準(zhǔn)確,因?yàn)?API 可能無(wú)法分析索引的某些細(xì)節(jié)部分。

本質(zhì)用途:

  • 技術(shù)人員可直觀看到索引各個(gè)字段占據(jù)存儲(chǔ)空間的大小。

  • 評(píng)估數(shù)據(jù)建模的合理性。

  • 定量指導(dǎo)Mapping 優(yōu)化。

3、_disk_usage API對(duì)應(yīng)版本?

7.15+ 之后的版本才可以用哦。

4、_disk_usage API 如何用?

POST kibana_sample_data_ecommerce/_disk_usage?run_expensive_tasks=true

注意一個(gè)細(xì)節(jié):run_expensive_tasks 意味著這個(gè) API 非常耗費(fèi)資源,所以大家別頻繁驗(yàn)證線上環(huán)境。

召回結(jié)果如下:

執(zhí)行結(jié)果部分截圖

每個(gè)字段的磁盤使用率清晰、明白的列舉出來了。

7.17 版本 Elasticsearch 集群驗(yàn)證一把:

POST _reindex
{
  "source": {
    "index""kibana_sample_data_logs",
    "_source": [
      "host",
      "index",
      "ip",
      "tags",
      "response"
    ]
  },
  "dest": {
    "index""kibana_sample_data_logs_ext"
  }
}

POST kibana_sample_data_logs_ext/_disk_usage?run_expensive_tasks=true

官方并沒有統(tǒng)計(jì),我把結(jié)果數(shù)據(jù)梳理統(tǒng)計(jì)了一下,如下兩張圖所示:

說明了啥? 

所有字段的存儲(chǔ)實(shí)際是:倒排索引所占據(jù)存儲(chǔ)空間大小 + doc_values 正排索引存儲(chǔ)空間大小 + store_fields 存儲(chǔ)空間大小等的總和。

再深問一句,這個(gè)和咱們最早設(shè)定的 Mapping 就有關(guān)系了,和數(shù)據(jù)建模就有關(guān)系了。

看一下 Mapping:

{
  "kibana_sample_data_logs_ext" : {
    "mappings" : {
      "properties" : {
        "host" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "index" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "ip" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "response" : {
          "type" : "long"
        },
        "tags" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

再進(jìn)一步看看各個(gè)字段所占據(jù)的存儲(chǔ)空間大?。?br>

能有什么結(jié)論?

  • _source 是占據(jù)存儲(chǔ)空間的。
  • 默認(rèn)的 Mapping 在 dynamic 默認(rèn)為 true 的前提下字符串類型會(huì)包含兩種類型:text 和 keyword,兩個(gè)是分別占據(jù)不同的存儲(chǔ)空間的。
  • 數(shù)據(jù)建模建議:如果只需要全文檢索,字符串類型設(shè)置 text 就足夠了。
  • 數(shù)據(jù)建模建議:如果不需要全文檢索只需要排序和聚合,字符串類型設(shè)置 keyword 就足夠了。
  • _version 是占據(jù)存儲(chǔ)空間的,咱們的 update_by_query 和  delete_by_query 本質(zhì)都是邏輯刪除,勢(shì)必會(huì)增加 _version 的空間。
  • 如果未來再有字段選型搞不定存儲(chǔ)空間的時(shí)候——用這個(gè) API 一下就搞定了。
  • 。。。。。
    還能進(jìn)一步推出很多有意思的結(jié)論。

5、_disk_usage API "牛逼"在什么地方?

之前我們對(duì)于磁盤占據(jù)空間是一個(gè)泛泛的整體概念,現(xiàn)在有了這個(gè) API 我們可以做的很細(xì)了。

具體到哪個(gè)字段占據(jù)了多少磁盤知道了以后,極大便利的指導(dǎo)我們的數(shù)據(jù)建模。

相當(dāng)于數(shù)據(jù)建模有了可量化的、可視化的參考依據(jù)。

之前兩個(gè)同事可能為某個(gè)字段的某些屬性的設(shè)置會(huì)爭(zhēng)吵,甚至吵得不可開交。

現(xiàn)在不需要了,“走兩步”,對(duì)比一下磁盤容量,直接就能給出孰優(yōu)孰劣的結(jié)論。

圖片來自:優(yōu)酷

6、小結(jié)

個(gè)人更期望的功能就是字段存儲(chǔ)空間的可視化功能,各個(gè)字段占據(jù)一目了然呈現(xiàn)出來,類似:search_profile 的功能。估計(jì)未來版本會(huì)出現(xiàn)。

歡迎大家留言說一下自己的思考。

您或者您的團(tuán)隊(duì)發(fā)現(xiàn)類似好用但相對(duì)小眾的“新功能”,也歡迎第一時(shí)間聯(lián)系我。我會(huì)盡自己的一點(diǎn)微薄之力,讓更多 Elastic 愛好者知道。

感謝魏子珺大佬!

推薦

1、重磅 | 死磕 Elasticsearch 方法論認(rèn)知清單(2021年國(guó)慶更新版)
2、Elasticsearch 7.X 進(jìn)階實(shí)戰(zhàn)私訓(xùn)課(口碑不錯(cuò))
3、如何系統(tǒng)的學(xué)習(xí) Elasticsearch ?
4、Elasticsearch 數(shù)據(jù)建模實(shí)戰(zhàn)指南
5、干貨 | 論Elasticsearch數(shù)據(jù)建模的重要性
6、從一個(gè)實(shí)戰(zhàn)問題再談 Elasticsearch 數(shù)據(jù)建模
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
技術(shù)分享丨Elasticsearch實(shí)操干貨分享
使用DockerCompose搭建部署Kibana
ELK日志分析系統(tǒng)(1)-基本環(huán)境搭建
記一次ES查詢數(shù)據(jù)突然變?yōu)榭盏膯栴}
ELK部署參考文檔
Kibana詳細(xì)入門教程
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服