archive_path: /home/teuthworker/mnt/teuthology/shwetabhosale-2026-02-17_05:03:47-orch:cephadm-wip-shweta-testing-2026-02-14-0018-distro-default-trial/51594
branch: wip-shweta-testing-2026-02-14-0018
description: orch:cephadm/workunits/{0-distro/ubuntu_22.04 agent/on mon_election/connectivity
  task/test_monitoring_stack_basic}
email: Shweta.Bhosale1@ibm.com
first_in_suite: false
flavor: default
job_id: '51594'
kernel:
  branch: distro
  kdb: 1
  sha1: distro
ktype: distro
last_in_suite: false
machine_type: trial
name: shwetabhosale-2026-02-17_05:03:47-orch:cephadm-wip-shweta-testing-2026-02-14-0018-distro-default-trial
no_nested_subset: false
os_type: ubuntu
os_version: '22.04'
overrides:
  admin_socket:
    branch: wip-shweta-testing-2026-02-14-0018
  ceph:
    conf:
      global:
        mon election default strategy: 3
      mgr:
        debug mgr: 20
        debug ms: 1
        mgr/cephadm/use_agent: true
      mon:
        debug mon: 20
        debug ms: 1
        debug paxos: 20
      osd:
        debug ms: 1
        debug osd: 20
    flavor: default
    log-ignorelist:
    - \(MDS_ALL_DOWN\)
    - \(MDS_UP_LESS_THAN_MAX\)
    - MON_DOWN
    - mons down
    - mon down
    - out of quorum
    - CEPHADM_STRAY_DAEMON
    - CEPHADM_FAILED_DAEMON
    log-only-match:
    - CEPHADM_
    sha1: f8acada04a9facc6b0d4adc891b97eb878425a98
  ceph-deploy:
    conf:
      client:
        log file: /var/log/ceph/ceph-$name.$pid.log
      mon: {}
  install:
    ceph:
      flavor: default
      sha1: f8acada04a9facc6b0d4adc891b97eb878425a98
  workunit:
    branch: wip-shweta-testing-2026-02-14-0018
    sha1: f8acada04a9facc6b0d4adc891b97eb878425a98
owner: scheduled_shwetabhosale@soko04.front.sepia.ceph.com
priority: 80
repo: https://git.ceph.com/ceph-ci.git
roles:
- - host.a
  - mon.a
  - mgr.a
  - osd.0
- - host.b
  - mon.b
  - mgr.b
  - osd.1
- - host.c
  - mon.c
  - osd.2
seed: 8890
sha1: f8acada04a9facc6b0d4adc891b97eb878425a98
sleep_before_teardown: 0
subset: 1/20
suite: orch:cephadm
suite_branch: wip-shweta-testing-2026-02-14-0018
suite_path: /home/teuthworker/src/git.ceph.com_ceph-c_f8acada04a9facc6b0d4adc891b97eb878425a98/qa
suite_relpath: qa
suite_repo: https://git.ceph.com/ceph-ci.git
suite_sha1: f8acada04a9facc6b0d4adc891b97eb878425a98
targets:
  trial139.front.sepia.ceph.com: ecdsa-sha2-nistp256 AAAAE2VjZHNhLXNoYTItbmlzdHAyNTYAAAAIbmlzdHAyNTYAAABBBJTzMyR08DlhABdtCQFDv2NICN/p9mUZjBQ8mW7d+Qzc9McuLCoHipUlIHdvQsC5f3LCGj4Frg3YbWNwvMyuZKA=
  trial186.front.sepia.ceph.com: ecdsa-sha2-nistp256 AAAAE2VjZHNhLXNoYTItbmlzdHAyNTYAAAAIbmlzdHAyNTYAAABBBH1SgaGaxPWgX0fJ6KjTVFRM/e3PMuRyFJVepnNmJppl7WrrtRHTo5dEJNOSmvwJNp8bV/DuHznzDs4lw5FnuEQ=
  trial187.front.sepia.ceph.com: ecdsa-sha2-nistp256 AAAAE2VjZHNhLXNoYTItbmlzdHAyNTYAAAAIbmlzdHAyNTYAAABBBH7cDVESeTlPhjIIfbimSvLEzZbT6dMF7Ypp4Xp94XciZ28Tx60N1YOYVD5jiG/gLUbYXUbvRUPMItMEoWXvCb0=
tasks:
- install: null
- cephadm: null
- cephadm.shell:
    host.a:
    - "set -e\nset -x\nceph orch apply node-exporter\nceph orch apply grafana\nceph\
      \ orch apply alertmanager\nceph orch apply prometheus\nsleep 240\nceph orch\
      \ ls\nceph orch ps\nceph orch host ls\nMON_DAEMON=$(ceph orch ps --daemon-type\
      \ mon -f json | jq -r 'last | .daemon_name')\nGRAFANA_HOST=$(ceph orch ps --daemon-type\
      \ grafana -f json | jq -e '.[]' | jq -r '.hostname')\nPROM_HOST=$(ceph orch\
      \ ps --daemon-type prometheus -f json | jq -e '.[]' | jq -r '.hostname')\nALERTM_HOST=$(ceph\
      \ orch ps --daemon-type alertmanager -f json | jq -e '.[]' | jq -r '.hostname')\n\
      GRAFANA_IP=$(ceph orch host ls -f json | jq -r --arg GRAFANA_HOST \"$GRAFANA_HOST\"\
      \ '.[] | select(.hostname==$GRAFANA_HOST) | .addr')\nPROM_IP=$(ceph orch host\
      \ ls -f json | jq -r --arg PROM_HOST \"$PROM_HOST\" '.[] | select(.hostname==$PROM_HOST)\
      \ | .addr')\nALERTM_IP=$(ceph orch host ls -f json | jq -r --arg ALERTM_HOST\
      \ \"$ALERTM_HOST\" '.[] | select(.hostname==$ALERTM_HOST) | .addr')\n# check\
      \ each host node-exporter metrics endpoint is responsive\nALL_HOST_IPS=$(ceph\
      \ orch host ls -f json | jq -r '.[] | .addr')\nfor ip in $ALL_HOST_IPS; do\n\
      \  curl -s http://${ip}:9100/metric\ndone\n# check grafana endpoints are responsive\
      \ and database health is okay\ncurl -k -s https://${GRAFANA_IP}:3000/api/health\n\
      curl -k -s https://${GRAFANA_IP}:3000/api/health | jq -e '.database == \"ok\"\
      '\n# stop mon daemon in order to trigger an alert\nceph orch daemon stop $MON_DAEMON\n\
      sleep 120\n# check prometheus endpoints are responsive and mon down alert is\
      \ firing\ncurl -s http://${PROM_IP}:9095/api/v1/status/config\ncurl -s http://${PROM_IP}:9095/api/v1/status/config\
      \ | jq -e '.status == \"success\"'\ncurl -s http://${PROM_IP}:9095/api/v1/alerts\n\
      curl -s http://${PROM_IP}:9095/api/v1/alerts | jq -e '.data | .alerts | .[]\
      \ | select(.labels | .alertname == \"CephMonDown\") | .state == \"firing\"'\n\
      # check alertmanager endpoints are responsive and mon down alert is active\n\
      curl -s http://${ALERTM_IP}:9093/api/v2/status\ncurl -s http://${ALERTM_IP}:9093/api/v2/alerts\n\
      curl -s http://${ALERTM_IP}:9093/api/v2/alerts | jq -e '.[] | select(.labels\
      \ | .alertname == \"CephMonDown\") | .status | .state == \"active\"'\n# check\
      \ prometheus metrics endpoint is not empty and make sure we can get metrics\n\
      METRICS_URL=$(ceph mgr services | jq -r .prometheus)\n[ -n \"$METRICS_URL\"\
      \ ] || exit 1\ncurl -s \"${METRICS_URL}metrics\" | grep -q '^ceph_health_status'\n"
teuthology:
  fragments_dropped: []
  meta: {}
  postmerge: []
teuthology_branch: main
teuthology_sha1: fa17720d0088c3ac28e473468bfc79eeaff5cd38
timestamp: 2026-02-17_05:03:47
tube: trial
user: shwetabhosale
verbose: false
worker_log: /home/teuthworker/mnt/teuthology/worker_logs/dispatcher.trial.3682