Merge "Use subqueryload() instead of joinedload() for (system_)metadata" into stable/victoria

author: Zuul <zuul@review.opendev.org> 2021-01-27 19:18:06 +0000
committer: Gerrit Code Review <review@openstack.org> 2021-01-27 19:18:06 +0000
commit: 795aa6c25d85b05f6dfc7252f14bdc058bab9419 (patch)
tree: dafde74359fdaf1f1ed4063c0f3883db600bda1a
parent: d82740de2df6d74c6c80aeeea3205faf5f6da719 (diff)
parent: 63d2e62c3a223f883ca810f4c66a2a236cf3d483 (diff)
download: nova-795aa6c25d85b05f6dfc7252f14bdc058bab9419.tar.gz
2 files changed, 24 insertions, 1 deletions
diff --git a/nova/db/sqlalchemy/api.py b/nova/db/sqlalchemy/api.py
index 973622a8f2..e523f575a1 100644
--- a/nova/db/sqlalchemy/api.py
+++ b/nova/db/sqlalchemy/api.py
@@ -47,6 +47,7 @@ from sqlalchemy import or_
 from sqlalchemy.orm import aliased
 from sqlalchemy.orm import joinedload
 from sqlalchemy.orm import noload
+from sqlalchemy.orm import subqueryload
 from sqlalchemy.orm import undefer
 from sqlalchemy.schema import Table
 from sqlalchemy import sql
@@ -1266,13 +1267,27 @@ def _build_instance_get(context, columns_to_join=None):
             continue
         if 'extra.' in column:
             query = query.options(undefer(column))
+        elif column in ['metadata', 'system_metadata']:
+            # NOTE(melwitt): We use subqueryload() instead of joinedload() for
+            # metadata and system_metadata because of the one-to-many
+            # relationship of the data. Directly joining these columns can
+            # result in a large number of additional rows being queried if an
+            # instance has a large number of (system_)metadata items, resulting
+            # in a large data transfer. Instead, the subqueryload() will
+            # perform additional queries to obtain metadata and system_metadata
+            # for the instance.
+            query = query.options(subqueryload(column))
         else:
             query = query.options(joinedload(column))
     # NOTE(alaski) Stop lazy loading of columns not needed.
     for col in ['metadata', 'system_metadata']:
         if col not in columns_to_join:
             query = query.options(noload(col))
-    return query
+    # NOTE(melwitt): We need to use order_by(<unique column>) so that the
+    # additional queries emitted by subqueryload() include the same ordering as
+    # used by the parent query.
+    # https://docs.sqlalchemy.org/en/13/orm/loading_relationships.html#the-importance-of-ordering
+    return query.order_by(models.Instance.id)
 
 
 def _instances_fill_metadata(context, instances, manual_joins=None):
diff --git a/nova/tests/unit/db/test_db_api.py b/nova/tests/unit/db/test_db_api.py
index cf662aad73..a9943f1c37 100644
--- a/nova/tests/unit/db/test_db_api.py
+++ b/nova/tests/unit/db/test_db_api.py
@@ -1693,6 +1693,14 @@ class InstanceTestCase(test.TestCase, ModelsObjectComparatorMixin):
             sys_meta = utils.metadata_to_dict(inst['system_metadata'])
             self.assertEqual(sys_meta, self.sample_data['system_metadata'])
 
+    def test_instance_get_with_meta(self):
+        inst_id = self.create_instance_with_args().id
+        inst = db.instance_get(self.ctxt, inst_id)
+        meta = utils.metadata_to_dict(inst['metadata'])
+        self.assertEqual(meta, self.sample_data['metadata'])
+        sys_meta = utils.metadata_to_dict(inst['system_metadata'])
+        self.assertEqual(sys_meta, self.sample_data['system_metadata'])
+
     def test_instance_update(self):
         instance = self.create_instance_with_args()
         metadata = {'host': 'bar', 'key2': 'wuff'}
author	Zuul <zuul@review.opendev.org>	2021-01-27 19:18:06 +0000
committer	Gerrit Code Review <review@openstack.org>	2021-01-27 19:18:06 +0000
commit	795aa6c25d85b05f6dfc7252f14bdc058bab9419 (patch)
tree	dafde74359fdaf1f1ed4063c0f3883db600bda1a
parent	d82740de2df6d74c6c80aeeea3205faf5f6da719 (diff)
parent	63d2e62c3a223f883ca810f4c66a2a236cf3d483 (diff)
download	nova-795aa6c25d85b05f6dfc7252f14bdc058bab9419.tar.gz