archive_path: /home/teuthworker/archive/dzafman-2020-01-25_01:21:34-upgrade:mimic-x-master-distro-basic-smithi/4711858
branch: master
description: upgrade:mimic-x/stress-split/{0-cluster/{openstack.yaml start.yaml} 1-ceph-install/mimic.yaml
  1.1-pg-log-overrides/normal_pg_log.yaml 2-partial-upgrade/firsthalf.yaml 3-thrash/default.yaml
  4-workload/{radosbench.yaml rbd-cls.yaml rbd-import-export.yaml rbd_api.yaml readwrite.yaml
  rgw_ragweed_prepare.yaml snaps-few-objects.yaml} 5-finish-upgrade.yaml 6-msgr2.yaml
  6-nautilus.yaml 7-final-workload/{rbd-python.yaml rgw-swift-ragweed_check.yaml snaps-many-objects.yaml}
  objectstore/filestore-xfs.yaml supported-all-distro/rhel_7.yaml thrashosds-health.yaml}
email: dzafman@redhat.com
first_in_suite: false
job_id: '4711858'
kernel:
  kdb: true
  sha1: distro
last_in_suite: false
machine_type: smithi
meta:
- desc: 'Run ceph on two nodes,

    with a separate client-only node.

    Use xfs beneath the osds.

    #Note-To enable RHEL runs on ovh nodes, add the following to overrides

    #ansible.cephlab:

    # skip_tags: entitlements,packages,repos

    '
- desc: install ceph/mimic latest
- desc: 'install upgrade ceph/-x on 2/3 of cluster

    restart : mons, osd 0-7

    '
- desc: 'randomly kill and revive osd

    small chance to increase the number of pgs

    '
- desc: 'run randomized correctness test for rados operations

    generate write load with rados bench

    '
- desc: 'run basic cls tests for rbd

    '
- desc: 'run basic import/export cli tests for rbd

    '
- desc: 'librbd C and C++ api tests

    '
- desc: 'randomized correctness test for rados operations on a replicated pool,

    using only reads, writes, and deletes

    '
- desc: 'rgw ragweed prepare before upgrade

    '
- desc: 'randomized correctness test for rados operations on a replicated pool with
    snapshot operations

    '
- desc: 'librbd python api tests

    '
- desc: 'swift api tests for rgw

    rgw ragweed check after upgrade

    '
- desc: 'randomized correctness test for rados operations on a replicated pool with
    snapshot operations

    '
name: dzafman-2020-01-25_01:21:34-upgrade:mimic-x-master-distro-basic-smithi
nuke-on-error: true
openstack:
- machine:
    disk: 100
- volumes:
    count: 4
    size: 30
os_type: rhel
os_version: '7.7'
overrides:
  admin_socket:
    branch: master
  ceph:
    conf:
      global:
        enable experimental unrecoverable data corrupting features: '*'
        mon warn on msgr2 not enabled: false
      mon:
        debug mon: 20
        debug ms: 1
        debug paxos: 20
        mon warn on osd down out interval zero: false
      osd:
        debug filestore: 20
        debug journal: 20
        debug ms: 1
        debug osd: 25
        osd objectstore: filestore
        osd sloppy crc: true
    fs: xfs
    log-whitelist:
    - \(MDS_ALL_DOWN\)
    - \(MDS_UP_LESS_THAN_MAX\)
    - overall HEALTH_
    - \(MON_DOWN\)
    - \(MGR_DOWN\)
    - \(MON_MSGR2_NOT_ENABLED\)
    - but it is still running
    - wrongly marked me down
    - objects unfound and apparently lost
    - log bound mismatch
    - overall HEALTH_
    - \(OSDMAP_FLAGS\)
    - \(OSD_
    - \(PG_
    - \(POOL_
    - \(CACHE_POOL_
    - \(SMALLER_PGP_NUM\)
    - \(OBJECT_
    - \(SLOW_OPS\)
    - \(REQUEST_SLOW\)
    - \(TOO_FEW_PGS\)
    - slow requests
    mon_bind_addrvec: false
    mon_bind_msgr2: false
    sha1: 9c19d0edb97c85432761f769828070f563587117
  ceph-deploy:
    conf:
      client:
        log file: /var/log/ceph/ceph-$name.$pid.log
      mon:
        osd default pool size: 2
      osd:
        osd objectstore: filestore
        osd sloppy crc: true
    filestore: true
    fs: xfs
  install:
    ceph:
      sha1: 9c19d0edb97c85432761f769828070f563587117
  workunit:
    branch: master
    sha1: 35b0b52153206fd6178afe584a2cd9c0ef2bcc05
owner: scheduled_dzafman@ubuntu-1804
priority: 50
repo: git://git.ceph.com/ceph-ci.git
roles:
- - mon.a
  - mgr.x
  - osd.0
  - osd.1
  - osd.2
  - osd.3
- - mon.b
  - osd.4
  - osd.5
  - osd.6
  - osd.7
- - mon.c
- - osd.8
  - osd.9
  - osd.10
  - osd.11
- - client.0
sha1: 9c19d0edb97c85432761f769828070f563587117
stress-tasks:
- thrashosds:
    aggressive_pg_num_changes: false
    chance_force_recovery: 0
    chance_pgnum_grow: 1
    chance_pgpnum_fix: 1
    chance_thrash_cluster_full: 0
    chance_thrash_pg_upmap: 0
    chance_thrash_pg_upmap_items: 0
    disable_objectstore_tool_tests: true
    timeout: 1200
- print: '**** done thrashosds 3-thrash'
- full_sequential:
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
  - radosbench:
      clients:
      - client.0
      time: 90
- print: '**** done radosbench 7-workload'
- workunit:
    branch: mimic
    clients:
      client.0:
      - cls/test_cls_rbd.sh
- print: '**** done cls/test_cls_rbd.sh 5-workload'
- workunit:
    branch: mimic
    clients:
      client.0:
      - rbd/import_export.sh
    env:
      RBD_CREATE_ARGS: --new-format
- print: '**** done rbd/import_export.sh 5-workload'
- workunit:
    branch: mimic
    clients:
      client.0:
      - rbd/test_librbd.sh
- print: '**** done rbd/test_librbd.sh 7-workload'
- full_sequential:
  - rados:
      clients:
      - client.0
      objects: 500
      op_weights:
        delete: 10
        read: 45
        write: 45
      ops: 4000
      write_append_excl: false
- print: '**** done rados/readwrite 5-workload'
- full_sequential:
  - sequential:
    - ragweed:
        client.0:
          default-branch: ceph-nautilus
          rgw_server: client.0
          stages: prepare
    - print: '**** done rgw ragweed prepare 4-workload'
- full_sequential:
  - rados:
      clients:
      - client.0
      objects: 50
      op_weights:
        delete: 50
        read: 100
        rollback: 50
        snap_create: 50
        snap_remove: 50
        write: 100
      ops: 4000
      write_append_excl: false
- print: '**** done rados/snaps-few-objects 5-workload'
suite: upgrade:mimic-x
suite_branch: master
suite_path: /home/teuthworker/src/git.ceph.com_ceph-c_master/qa
suite_relpath: qa
suite_repo: git://git.ceph.com/ceph-ci.git
suite_sha1: 35b0b52153206fd6178afe584a2cd9c0ef2bcc05
tasks:
- install:
    branch: mimic
    exclude_packages:
    - librados3
    - ceph-mgr-dashboard
    - ceph-mgr-diskprediction-local
    - ceph-mgr-diskprediction-cloud
    - ceph-mgr-rook
    - ceph-mgr-ssh
    - ceph-daemon
    extra_packages:
    - librados2
- print: '**** done install mimic'
- ceph:
    conf:
      global:
        bluestore warn on no per pool omap: false
        bluestore_warn_on_legacy_statfs: false
- exec:
    osd.0:
    - ceph osd require-osd-release mimic
    - ceph osd set-require-min-compat-client mimic
- print: '**** done ceph'
- rgw:
  - client.0
- print: '**** done => started rgw client.0'
- install.upgrade:
    mon.a: null
    mon.b: null
    mon.c: null
- print: '**** done install.upgrade first 3 nodes'
- ceph.restart:
    daemons:
    - mon.a
    - mon.b
    - mon.c
    - mgr.x
    - osd.0
    - osd.1
    - osd.2
    - osd.3
    - osd.4
    - osd.5
    - osd.6
    - osd.7
    mon-health-to-clog: false
- print: '**** done ceph.restart all mons and 2/3 of osds'
- parallel:
  - stress-tasks
- install.upgrade:
    client.0: null
    osd.8: null
- ceph.restart:
    daemons:
    - osd.8
    - osd.9
    - osd.10
    - osd.11
    - rgw.*
    wait-for-healthy: false
    wait-for-osds-up: true
- print: '**** done restarted/upgraded => osd.8, osd.9, osd.10, osd.11, rgw.*'
- exec:
    osd.0:
    - ceph osd set pglog_hardlimit
    - ceph osd dump --format=json-pretty | grep "flags"
- print: '**** done try to set pglog_hardlimit again, should succeed'
- exec:
    mon.a:
    - ceph mon enable-msgr2
- ceph.healthy: null
- exec:
    osd.0:
    - ceph osd require-osd-release nautilus
    - ceph osd set-require-min-compat-client nautilus
    - for p in `ceph osd pool ls`; do ceph osd pool set $p pg_autoscale_mode off;
      done
- ceph.healthy: null
- workunit:
    branch: mimic
    clients:
      client.0:
      - rbd/test_librbd_python.sh
- print: '**** done rbd/test_librbd_python.sh 9-workload'
- swift:
    client.0:
      rgw_server: client.0
- print: '**** done swift 7-workload'
- ragweed:
    client.0:
      default-branch: ceph-nautilus
      rgw_server: client.0
      stages: check
- print: '**** done rgw ragweed check 7-workload'
- rados:
    clients:
    - client.0
    objects: 500
    op_weights:
      delete: 50
      read: 100
      rollback: 50
      snap_create: 50
      snap_remove: 50
      write: 100
    ops: 4000
    write_append_excl: false
teuthology_branch: master
tube: smithi
verbose: false
worker_log: /home/teuthworker/archive/worker_logs/worker.smithi.17179