9 years ago · 6f6e68b383
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h
@@ -85,8 +85,12 @@ extern int amdgpu_vm_debug;
 
				 extern int amdgpu_sched_jobs;
			
 
				 extern int amdgpu_sched_hw_submission;
			
 
				 extern int amdgpu_powerplay;
			
 
				+extern int amdgpu_powercontainment;
			
 
				 extern unsigned amdgpu_pcie_gen_cap;
			
 
				 extern unsigned amdgpu_pcie_lane_cap;
			
 
				+extern unsigned amdgpu_cg_mask;
			
 
				+extern unsigned amdgpu_pg_mask;
			
 
				+extern char *amdgpu_disable_cu;
			
 
				 
			
 
				 #define AMDGPU_WAIT_IDLE_TIMEOUT_IN_MS	        3000
			
 
				 #define AMDGPU_MAX_USEC_TIMEOUT			100000	/* 100 ms */
			
@@ -183,6 +187,10 @@ int amdgpu_set_clockgating_state(struct amdgpu_device *adev,
 
				 int amdgpu_set_powergating_state(struct amdgpu_device *adev,
			
 
				 				  enum amd_ip_block_type block_type,
			
 
				 				  enum amd_powergating_state state);
			
 
				+int amdgpu_wait_for_idle(struct amdgpu_device *adev,
			
 
				+			 enum amd_ip_block_type block_type);
			
 
				+bool amdgpu_is_idle(struct amdgpu_device *adev,
			
 
				+		    enum amd_ip_block_type block_type);
			
 
				 
			
 
				 struct amdgpu_ip_block_version {
			
 
				 	enum amd_ip_block_type type;
			
@@ -594,11 +602,9 @@ int amdgpu_sync_resv(struct amdgpu_device *adev,
 
				 		     struct amdgpu_sync *sync,
			
 
				 		     struct reservation_object *resv,
			
 
				 		     void *owner);
			
 
				-bool amdgpu_sync_is_idle(struct amdgpu_sync *sync);
			
 
				-int amdgpu_sync_cycle_fences(struct amdgpu_sync *dst, struct amdgpu_sync *src,
			
 
				-			     struct fence *fence);
			
 
				+struct fence *amdgpu_sync_peek_fence(struct amdgpu_sync *sync,
			
 
				+				     struct amdgpu_ring *ring);
			
 
				 struct fence *amdgpu_sync_get_fence(struct amdgpu_sync *sync);
			
 
				-int amdgpu_sync_wait(struct amdgpu_sync *sync);
			
 
				 void amdgpu_sync_free(struct amdgpu_sync *sync);
			
 
				 int amdgpu_sync_init(void);
			
 
				 void amdgpu_sync_fini(void);
			
@@ -754,12 +760,11 @@ int amdgpu_job_alloc(struct amdgpu_device *adev, unsigned num_ibs,
 
				 int amdgpu_job_alloc_with_ib(struct amdgpu_device *adev, unsigned size,
			
 
				 			     struct amdgpu_job **job);
			
 
				 
			
 
				+void amdgpu_job_free_resources(struct amdgpu_job *job);
			
 
				 void amdgpu_job_free(struct amdgpu_job *job);
			
 
				-void amdgpu_job_free_func(struct kref *refcount);
			
 
				 int amdgpu_job_submit(struct amdgpu_job *job, struct amdgpu_ring *ring,
			
 
				 		      struct amd_sched_entity *entity, void *owner,
			
 
				 		      struct fence **f);
			
 
				-void amdgpu_job_timeout_func(struct work_struct *work);
			
 
				 
			
 
				 struct amdgpu_ring {
			
 
				 	struct amdgpu_device		*adev;
			
@@ -771,8 +776,6 @@ struct amdgpu_ring {
 
				 	struct amdgpu_bo	*ring_obj;
			
 
				 	volatile uint32_t	*ring;
			
 
				 	unsigned		rptr_offs;
			
 
				-	u64			next_rptr_gpu_addr;
			
 
				-	volatile u32		*next_rptr_cpu_addr;
			
 
				 	unsigned		wptr;
			
 
				 	unsigned		wptr_old;
			
 
				 	unsigned		ring_size;
			
@@ -791,7 +794,6 @@ struct amdgpu_ring {
 
				 	u32			doorbell_index;
			
 
				 	bool			use_doorbell;
			
 
				 	unsigned		wptr_offs;
			
 
				-	unsigned		next_rptr_offs;
			
 
				 	unsigned		fence_offs;
			
 
				 	uint64_t		current_ctx;
			
 
				 	enum amdgpu_ring_type	type;
			
@@ -799,6 +801,9 @@ struct amdgpu_ring {
 
				 	unsigned		cond_exe_offs;
			
 
				 	u64				cond_exe_gpu_addr;
			
 
				 	volatile u32	*cond_exe_cpu_addr;
			
 
				+#if defined(CONFIG_DEBUG_FS)
			
 
				+	struct dentry *ent;
			
 
				+#endif
			
 
				 };
			
 
				 
			
 
				 /*
			
@@ -861,6 +866,7 @@ struct amdgpu_vm {
 
				 	struct amdgpu_bo	*page_directory;
			
 
				 	unsigned		max_pde_used;
			
 
				 	struct fence		*page_directory_fence;
			
 
				+	uint64_t		last_eviction_counter;
			
 
				 
			
 
				 	/* array of page tables, one for each page directory entry */
			
 
				 	struct amdgpu_vm_pt	*page_tables;
			
@@ -883,13 +889,14 @@ struct amdgpu_vm_id {
 
				 	struct fence		*first;
			
 
				 	struct amdgpu_sync	active;
			
 
				 	struct fence		*last_flush;
			
 
				-	struct amdgpu_ring      *last_user;
			
 
				 	atomic64_t		owner;
			
 
				 
			
 
				 	uint64_t		pd_gpu_addr;
			
 
				 	/* last flushed PD/PT update */
			
 
				 	struct fence		*flushed_updates;
			
 
				 
			
 
				+	uint32_t                current_gpu_reset_count;
			
 
				+
			
 
				 	uint32_t		gds_base;
			
 
				 	uint32_t		gds_size;
			
 
				 	uint32_t		gws_base;
			
@@ -905,6 +912,10 @@ struct amdgpu_vm_manager {
 
				 	struct list_head			ids_lru;
			
 
				 	struct amdgpu_vm_id			ids[AMDGPU_NUM_VM];
			
 
				 
			
 
				+	/* Handling of VM fences */
			
 
				+	u64					fence_context;
			
 
				+	unsigned				seqno[AMDGPU_MAX_RINGS];
			
 
				+
			
 
				 	uint32_t				max_pfn;
			
 
				 	/* vram base address for page table entry  */
			
 
				 	u64					vram_base_offset;
			
@@ -926,17 +937,14 @@ void amdgpu_vm_fini(struct amdgpu_device *adev, struct amdgpu_vm *vm);
 
				 void amdgpu_vm_get_pd_bo(struct amdgpu_vm *vm,
			
 
				 			 struct list_head *validated,
			
 
				 			 struct amdgpu_bo_list_entry *entry);
			
 
				-void amdgpu_vm_get_pt_bos(struct amdgpu_vm *vm, struct list_head *duplicates);
			
 
				+void amdgpu_vm_get_pt_bos(struct amdgpu_device *adev, struct amdgpu_vm *vm,
			
 
				+			  struct list_head *duplicates);
			
 
				 void amdgpu_vm_move_pt_bos_in_lru(struct amdgpu_device *adev,
			
 
				 				  struct amdgpu_vm *vm);
			
 
				 int amdgpu_vm_grab_id(struct amdgpu_vm *vm, struct amdgpu_ring *ring,
			
 
				 		      struct amdgpu_sync *sync, struct fence *fence,
			
 
				-		      unsigned *vm_id, uint64_t *vm_pd_addr);
			
 
				-int amdgpu_vm_flush(struct amdgpu_ring *ring,
			
 
				-		    unsigned vm_id, uint64_t pd_addr,
			
 
				-		    uint32_t gds_base, uint32_t gds_size,
			
 
				-		    uint32_t gws_base, uint32_t gws_size,
			
 
				-		    uint32_t oa_base, uint32_t oa_size);
			
 
				+		      struct amdgpu_job *job);
			
 
				+int amdgpu_vm_flush(struct amdgpu_ring *ring, struct amdgpu_job *job);
			
 
				 void amdgpu_vm_reset_id(struct amdgpu_device *adev, unsigned vm_id);
			
 
				 uint64_t amdgpu_vm_map_gart(const dma_addr_t *pages_addr, uint64_t addr);
			
 
				 int amdgpu_vm_update_page_directory(struct amdgpu_device *adev,
			
@@ -1142,6 +1150,12 @@ struct amdgpu_cu_info {
 
				 	uint32_t bitmap[4][4];
			
 
				 };
			
 
				 
			
 
				+struct amdgpu_gfx_funcs {
			
 
				+	/* get the gpu clock counter */
			
 
				+	uint64_t (*get_gpu_clock_counter)(struct amdgpu_device *adev);
			
 
				+	void (*select_se_sh)(struct amdgpu_device *adev, u32 se_num, u32 sh_num, u32 instance);
			
 
				+};
			
 
				+
			
 
				 struct amdgpu_gfx {
			
 
				 	struct mutex			gpu_clock_mutex;
			
 
				 	struct amdgpu_gca_config	config;
			
@@ -1178,6 +1192,7 @@ struct amdgpu_gfx {
 
				 	/* ce ram size*/
			
 
				 	unsigned			ce_ram_size;
			
 
				 	struct amdgpu_cu_info		cu_info;
			
 
				+	const struct amdgpu_gfx_funcs	*funcs;
			
 
				 };
			
 
				 
			
 
				 int amdgpu_ib_get(struct amdgpu_device *adev, struct amdgpu_vm *vm,
			
@@ -1195,10 +1210,6 @@ void amdgpu_ring_insert_nop(struct amdgpu_ring *ring, uint32_t count);
 
				 void amdgpu_ring_generic_pad_ib(struct amdgpu_ring *ring, struct amdgpu_ib *ib);
			
 
				 void amdgpu_ring_commit(struct amdgpu_ring *ring);
			
 
				 void amdgpu_ring_undo(struct amdgpu_ring *ring);
			
 
				-unsigned amdgpu_ring_backup(struct amdgpu_ring *ring,
			
 
				-			    uint32_t **data);
			
 
				-int amdgpu_ring_restore(struct amdgpu_ring *ring,
			
 
				-			unsigned size, uint32_t *data);
			
 
				 int amdgpu_ring_init(struct amdgpu_device *adev, struct amdgpu_ring *ring,
			
 
				 		     unsigned ring_size, u32 nop, u32 align_mask,
			
 
				 		     struct amdgpu_irq_src *irq_src, unsigned irq_type,
			
@@ -1250,6 +1261,7 @@ struct amdgpu_job {
 
				 	uint32_t		num_ibs;
			
 
				 	void			*owner;
			
 
				 	uint64_t		ctx;
			
 
				+	bool                    vm_needs_flush;
			
 
				 	unsigned		vm_id;
			
 
				 	uint64_t		vm_pd_addr;
			
 
				 	uint32_t		gds_base, gds_size;
			
@@ -1257,8 +1269,7 @@ struct amdgpu_job {
 
				 	uint32_t		oa_base, oa_size;
			
 
				 
			
 
				 	/* user fence handling */
			
 
				-	struct amdgpu_bo	*uf_bo;
			
 
				-	uint32_t		uf_offset;
			
 
				+	uint64_t		uf_addr;
			
 
				 	uint64_t		uf_sequence;
			
 
				 
			
 
				 };
			
@@ -1560,6 +1571,12 @@ struct amdgpu_dpm_funcs {
 
				 	u32 (*get_fan_control_mode)(struct amdgpu_device *adev);
			
 
				 	int (*set_fan_speed_percent)(struct amdgpu_device *adev, u32 speed);
			
 
				 	int (*get_fan_speed_percent)(struct amdgpu_device *adev, u32 *speed);
			
 
				+	int (*force_clock_level)(struct amdgpu_device *adev, enum pp_clock_type type, uint32_t mask);
			
 
				+	int (*print_clock_levels)(struct amdgpu_device *adev, enum pp_clock_type type, char *buf);
			
 
				+	int (*get_sclk_od)(struct amdgpu_device *adev);
			
 
				+	int (*set_sclk_od)(struct amdgpu_device *adev, uint32_t value);
			
 
				+	int (*get_mclk_od)(struct amdgpu_device *adev);
			
 
				+	int (*set_mclk_od)(struct amdgpu_device *adev, uint32_t value);
			
 
				 };
			
 
				 
			
 
				 struct amdgpu_dpm {
			
@@ -1767,6 +1784,8 @@ int amdgpu_debugfs_init(struct drm_minor *minor);
 
				 void amdgpu_debugfs_cleanup(struct drm_minor *minor);
			
 
				 #endif
			
 
				 
			
 
				+int amdgpu_debugfs_firmware_init(struct amdgpu_device *adev);
			
 
				+
			
 
				 /*
			
 
				  * amdgpu smumgr functions
			
 
				  */
			
@@ -1811,12 +1830,8 @@ struct amdgpu_asic_funcs {
 
				 			     u32 sh_num, u32 reg_offset, u32 *value);
			
 
				 	void (*set_vga_state)(struct amdgpu_device *adev, bool state);
			
 
				 	int (*reset)(struct amdgpu_device *adev);
			
 
				-	/* wait for mc_idle */
			
 
				-	int (*wait_for_mc_idle)(struct amdgpu_device *adev);
			
 
				 	/* get the reference clock */
			
 
				 	u32 (*get_xclk)(struct amdgpu_device *adev);
			
 
				-	/* get the gpu clock counter */
			
 
				-	uint64_t (*get_gpu_clock_counter)(struct amdgpu_device *adev);
			
 
				 	/* MM block clocks */
			
 
				 	int (*set_uvd_clocks)(struct amdgpu_device *adev, u32 vclk, u32 dclk);
			
 
				 	int (*set_vce_clocks)(struct amdgpu_device *adev, u32 evclk, u32 ecclk);
			
@@ -2003,6 +2018,10 @@ struct amdgpu_device {
 
				 	spinlock_t didt_idx_lock;
			
 
				 	amdgpu_rreg_t			didt_rreg;
			
 
				 	amdgpu_wreg_t			didt_wreg;
			
 
				+	/* protects concurrent gc_cac register access */
			
 
				+	spinlock_t gc_cac_idx_lock;
			
 
				+	amdgpu_rreg_t			gc_cac_rreg;
			
 
				+	amdgpu_wreg_t			gc_cac_wreg;
			
 
				 	/* protects concurrent ENDPOINT (audio) register access */
			
 
				 	spinlock_t audio_endpt_idx_lock;
			
 
				 	amdgpu_block_rreg_t		audio_endpt_rreg;
			
@@ -2028,6 +2047,7 @@ struct amdgpu_device {
 
				 	atomic64_t			vram_vis_usage;
			
 
				 	atomic64_t			gtt_usage;
			
 
				 	atomic64_t			num_bytes_moved;
			
 
				+	atomic64_t			num_evictions;
			
 
				 	atomic_t			gpu_reset_counter;
			
 
				 
			
 
				 	/* display */
			
@@ -2131,6 +2151,8 @@ void amdgpu_mm_wdoorbell(struct amdgpu_device *adev, u32 index, u32 v);
 
				 #define WREG32_UVD_CTX(reg, v) adev->uvd_ctx_wreg(adev, (reg), (v))
			
 
				 #define RREG32_DIDT(reg) adev->didt_rreg(adev, (reg))
			
 
				 #define WREG32_DIDT(reg, v) adev->didt_wreg(adev, (reg), (v))
			
 
				+#define RREG32_GC_CAC(reg) adev->gc_cac_rreg(adev, (reg))
			
 
				+#define WREG32_GC_CAC(reg, v) adev->gc_cac_wreg(adev, (reg), (v))
			
 
				 #define RREG32_AUDIO_ENDPT(block, reg) adev->audio_endpt_rreg(adev, (block), (reg))
			
 
				 #define WREG32_AUDIO_ENDPT(block, reg, v) adev->audio_endpt_wreg(adev, (block), (reg), (v))
			
 
				 #define WREG32_P(reg, val, mask)				\
			
@@ -2206,12 +2228,10 @@ amdgpu_get_sdma_instance(struct amdgpu_ring *ring)
 
				  */
			
 
				 #define amdgpu_asic_set_vga_state(adev, state) (adev)->asic_funcs->set_vga_state((adev), (state))
			
 
				 #define amdgpu_asic_reset(adev) (adev)->asic_funcs->reset((adev))
			
 
				-#define amdgpu_asic_wait_for_mc_idle(adev) (adev)->asic_funcs->wait_for_mc_idle((adev))
			
 
				 #define amdgpu_asic_get_xclk(adev) (adev)->asic_funcs->get_xclk((adev))
			
 
				 #define amdgpu_asic_set_uvd_clocks(adev, v, d) (adev)->asic_funcs->set_uvd_clocks((adev), (v), (d))
			
 
				 #define amdgpu_asic_set_vce_clocks(adev, ev, ec) (adev)->asic_funcs->set_vce_clocks((adev), (ev), (ec))
			
 
				 #define amdgpu_asic_get_virtual_caps(adev) ((adev)->asic_funcs->get_virtual_caps((adev)))
			
 
				-#define amdgpu_asic_get_gpu_clock_counter(adev) (adev)->asic_funcs->get_gpu_clock_counter((adev))
			
 
				 #define amdgpu_asic_read_disabled_bios(adev) (adev)->asic_funcs->read_disabled_bios((adev))
			
 
				 #define amdgpu_asic_read_bios_from_rom(adev, b, l) (adev)->asic_funcs->read_bios_from_rom((adev), (b), (l))
			
 
				 #define amdgpu_asic_read_register(adev, se, sh, offset, v)((adev)->asic_funcs->read_register((adev), (se), (sh), (offset), (v)))
			
@@ -2264,6 +2284,8 @@ amdgpu_get_sdma_instance(struct amdgpu_ring *ring)
 
				 #define amdgpu_dpm_print_power_state(adev, ps) (adev)->pm.funcs->print_power_state((adev), (ps))
			
 
				 #define amdgpu_dpm_vblank_too_short(adev) (adev)->pm.funcs->vblank_too_short((adev))
			
 
				 #define amdgpu_dpm_enable_bapm(adev, e) (adev)->pm.funcs->enable_bapm((adev), (e))
			
 
				+#define amdgpu_gfx_get_gpu_clock_counter(adev) (adev)->gfx.funcs->get_gpu_clock_counter((adev))
			
 
				+#define amdgpu_gfx_select_se_sh(adev, se, sh, instance) (adev)->gfx.funcs->select_se_sh((adev), (se), (sh), (instance))
			
 
				 
			
 
				 #define amdgpu_dpm_get_temperature(adev) \
			
 
				 	((adev)->pp_enabled ?						\
			
@@ -2342,6 +2364,18 @@ amdgpu_get_sdma_instance(struct amdgpu_ring *ring)
 
				 #define amdgpu_dpm_force_clock_level(adev, type, level) \
			
 
				 		(adev)->powerplay.pp_funcs->force_clock_level((adev)->powerplay.pp_handle, type, level)
			
 
				 
			
 
				+#define amdgpu_dpm_get_sclk_od(adev) \
			
 
				+	(adev)->powerplay.pp_funcs->get_sclk_od((adev)->powerplay.pp_handle)
			
 
				+
			
 
				+#define amdgpu_dpm_set_sclk_od(adev, value) \
			
 
				+	(adev)->powerplay.pp_funcs->set_sclk_od((adev)->powerplay.pp_handle, value)
			
 
				+
			
 
				+#define amdgpu_dpm_get_mclk_od(adev) \
			
 
				+	((adev)->powerplay.pp_funcs->get_mclk_od((adev)->powerplay.pp_handle))
			
 
				+
			
 
				+#define amdgpu_dpm_set_mclk_od(adev, value) \
			
 
				+	((adev)->powerplay.pp_funcs->set_mclk_od((adev)->powerplay.pp_handle, value))
			
 
				+
			
 
				 #define amdgpu_dpm_dispatch_task(adev, event_id, input, output)		\
			
 
				 	(adev)->powerplay.pp_funcs->dispatch_tasks((adev)->powerplay.pp_handle, (event_id), (input), (output))
			
 
				 
			
@@ -2383,9 +2417,13 @@ bool amdgpu_device_is_px(struct drm_device *dev);
 
				 #if defined(CONFIG_VGA_SWITCHEROO)
			
 
				 void amdgpu_register_atpx_handler(void);
			
 
				 void amdgpu_unregister_atpx_handler(void);
			
 
				+bool amdgpu_has_atpx_dgpu_power_cntl(void);
			
 
				+bool amdgpu_is_atpx_hybrid(void);
			
 
				 #else
			
 
				 static inline void amdgpu_register_atpx_handler(void) {}
			
 
				 static inline void amdgpu_unregister_atpx_handler(void) {}
			
 
				+static inline bool amdgpu_has_atpx_dgpu_power_cntl(void) { return false; }
			
 
				+static inline bool amdgpu_is_atpx_hybrid(void) { return false; }
			
 
				 #endif
			
 
				 
			
 
				 /*
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
@@ -240,8 +240,8 @@ uint64_t get_gpu_clock_counter(struct kgd_dev *kgd)
 
				 {
			
 
				 	struct amdgpu_device *rdev = (struct amdgpu_device *)kgd;
			
 
				 
			
 
				-	if (rdev->asic_funcs->get_gpu_clock_counter)
			
 
				-		return rdev->asic_funcs->get_gpu_clock_counter(rdev);
			
 
				+	if (rdev->gfx.funcs->get_gpu_clock_counter)
			
 
				+		return rdev->gfx.funcs->get_gpu_clock_counter(rdev);
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_atpx_handler.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_atpx_handler.c
@@ -10,6 +10,7 @@
 
				 #include <linux/slab.h>
			
 
				 #include <linux/acpi.h>
			
 
				 #include <linux/pci.h>
			
 
				+#include <linux/delay.h>
			
 
				 
			
 
				 #include "amd_acpi.h"
			
 
				 
			
@@ -27,6 +28,7 @@ struct amdgpu_atpx_functions {
 
				 struct amdgpu_atpx {
			
 
				 	acpi_handle handle;
			
 
				 	struct amdgpu_atpx_functions functions;
			
 
				+	bool is_hybrid;
			
 
				 };
			
 
				 
			
 
				 static struct amdgpu_atpx_priv {
			
@@ -63,6 +65,14 @@ bool amdgpu_has_atpx(void) {
 
				 	return amdgpu_atpx_priv.atpx_detected;
			
 
				 }
			
 
				 
			
 
				+bool amdgpu_has_atpx_dgpu_power_cntl(void) {
			
 
				+	return amdgpu_atpx_priv.atpx.functions.power_cntl;
			
 
				+}
			
 
				+
			
 
				+bool amdgpu_is_atpx_hybrid(void) {
			
 
				+	return amdgpu_atpx_priv.atpx.is_hybrid;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * amdgpu_atpx_call - call an ATPX method
			
 
				  *
			
@@ -142,18 +152,12 @@ static void amdgpu_atpx_parse_functions(struct amdgpu_atpx_functions *f, u32 mas
 
				  */
			
 
				 static int amdgpu_atpx_validate(struct amdgpu_atpx *atpx)
			
 
				 {
			
 
				-	/* make sure required functions are enabled */
			
 
				-	/* dGPU power control is required */
			
 
				-	if (atpx->functions.power_cntl == false) {
			
 
				-		printk("ATPX dGPU power cntl not present, forcing\n");
			
 
				-		atpx->functions.power_cntl = true;
			
 
				-	}
			
 
				+	u32 valid_bits = 0;
			
 
				 
			
 
				 	if (atpx->functions.px_params) {
			
 
				 		union acpi_object *info;
			
 
				 		struct atpx_px_params output;
			
 
				 		size_t size;
			
 
				-		u32 valid_bits;
			
 
				 
			
 
				 		info = amdgpu_atpx_call(atpx->handle, ATPX_FUNCTION_GET_PX_PARAMETERS, NULL);
			
 
				 		if (!info)
			
@@ -172,19 +176,43 @@ static int amdgpu_atpx_validate(struct amdgpu_atpx *atpx)
 
				 		memcpy(&output, info->buffer.pointer, size);
			
 
				 
			
 
				 		valid_bits = output.flags & output.valid_flags;
			
 
				-		/* if separate mux flag is set, mux controls are required */
			
 
				-		if (valid_bits & ATPX_SEPARATE_MUX_FOR_I2C) {
			
 
				-			atpx->functions.i2c_mux_cntl = true;
			
 
				-			atpx->functions.disp_mux_cntl = true;
			
 
				-		}
			
 
				-		/* if any outputs are muxed, mux controls are required */
			
 
				-		if (valid_bits & (ATPX_CRT1_RGB_SIGNAL_MUXED |
			
 
				-				  ATPX_TV_SIGNAL_MUXED |
			
 
				-				  ATPX_DFP_SIGNAL_MUXED))
			
 
				-			atpx->functions.disp_mux_cntl = true;
			
 
				 
			
 
				 		kfree(info);
			
 
				 	}
			
 
				+
			
 
				+	/* if separate mux flag is set, mux controls are required */
			
 
				+	if (valid_bits & ATPX_SEPARATE_MUX_FOR_I2C) {
			
 
				+		atpx->functions.i2c_mux_cntl = true;
			
 
				+		atpx->functions.disp_mux_cntl = true;
			
 
				+	}
			
 
				+	/* if any outputs are muxed, mux controls are required */
			
 
				+	if (valid_bits & (ATPX_CRT1_RGB_SIGNAL_MUXED |
			
 
				+			  ATPX_TV_SIGNAL_MUXED |
			
 
				+			  ATPX_DFP_SIGNAL_MUXED))
			
 
				+		atpx->functions.disp_mux_cntl = true;
			
 
				+
			
 
				+
			
 
				+	/* some bioses set these bits rather than flagging power_cntl as supported */
			
 
				+	if (valid_bits & (ATPX_DYNAMIC_PX_SUPPORTED |
			
 
				+			  ATPX_DYNAMIC_DGPU_POWER_OFF_SUPPORTED))
			
 
				+		atpx->functions.power_cntl = true;
			
 
				+
			
 
				+	atpx->is_hybrid = false;
			
 
				+	if (valid_bits & ATPX_MS_HYBRID_GFX_SUPPORTED) {
			
 
				+		printk("ATPX Hybrid Graphics\n");
			
 
				+#if 1
			
 
				+		/* This is a temporary hack until the D3 cold support
			
 
				+		 * makes it upstream.  The ATPX power_control method seems
			
 
				+		 * to still work on even if the system should be using
			
 
				+		 * the new standardized hybrid D3 cold ACPI interface.
			
 
				+		 */
			
 
				+		atpx->functions.power_cntl = true;
			
 
				+#else
			
 
				+		atpx->functions.power_cntl = false;
			
 
				+#endif
			
 
				+		atpx->is_hybrid = true;
			
 
				+	}
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -259,6 +287,10 @@ static int amdgpu_atpx_set_discrete_state(struct amdgpu_atpx *atpx, u8 state)
 
				 		if (!info)
			
 
				 			return -EIO;
			
 
				 		kfree(info);
			
 
				+
			
 
				+		/* 200ms delay is required after off */
			
 
				+		if (state == 0)
			
 
				+			msleep(200);
			
 
				 	}
			
 
				 	return 0;
			
 
				 }
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_bo_list.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_bo_list.c
@@ -94,6 +94,7 @@ static int amdgpu_bo_list_set(struct amdgpu_device *adev,
 
				 	unsigned last_entry = 0, first_userptr = num_entries;
			
 
				 	unsigned i;
			
 
				 	int r;
			
 
				+	unsigned long total_size = 0;
			
 
				 
			
 
				 	array = drm_malloc_ab(num_entries, sizeof(struct amdgpu_bo_list_entry));
			
 
				 	if (!array)
			
@@ -140,6 +141,7 @@ static int amdgpu_bo_list_set(struct amdgpu_device *adev,
 
				 		if (entry->robj->prefered_domains == AMDGPU_GEM_DOMAIN_OA)
			
 
				 			oa_obj = entry->robj;
			
 
				 
			
 
				+		total_size += amdgpu_bo_size(entry->robj);
			
 
				 		trace_amdgpu_bo_list_set(list, entry->robj);
			
 
				 	}
			
 
				 
			
@@ -155,6 +157,7 @@ static int amdgpu_bo_list_set(struct amdgpu_device *adev,
 
				 	list->array = array;
			
 
				 	list->num_entries = num_entries;
			
 
				 
			
 
				+	trace_amdgpu_cs_bo_status(list->num_entries, total_size);
			
 
				 	return 0;
			
 
				 
			
 
				 error_free:
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_cgs.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_cgs.c
@@ -312,6 +312,8 @@ static uint32_t amdgpu_cgs_read_ind_register(struct cgs_device *cgs_device,
 
				 		return RREG32_UVD_CTX(index);
			
 
				 	case CGS_IND_REG__DIDT:
			
 
				 		return RREG32_DIDT(index);
			
 
				+	case CGS_IND_REG_GC_CAC:
			
 
				+		return RREG32_GC_CAC(index);
			
 
				 	case CGS_IND_REG__AUDIO_ENDPT:
			
 
				 		DRM_ERROR("audio endpt register access not implemented.\n");
			
 
				 		return 0;
			
@@ -336,6 +338,8 @@ static void amdgpu_cgs_write_ind_register(struct cgs_device *cgs_device,
 
				 		return WREG32_UVD_CTX(index, value);
			
 
				 	case CGS_IND_REG__DIDT:
			
 
				 		return WREG32_DIDT(index, value);
			
 
				+	case CGS_IND_REG_GC_CAC:
			
 
				+		return WREG32_GC_CAC(index, value);
			
 
				 	case CGS_IND_REG__AUDIO_ENDPT:
			
 
				 		DRM_ERROR("audio endpt register access not implemented.\n");
			
 
				 		return;
			
@@ -787,6 +791,7 @@ static int amdgpu_cgs_get_firmware_info(struct cgs_device *cgs_device,
 
				 		}
			
 
				 
			
 
				 		hdr = (const struct smc_firmware_header_v1_0 *)	adev->pm.fw->data;
			
 
				+		amdgpu_ucode_print_smc_hdr(&hdr->header);
			
 
				 		adev->pm.fw_version = le32_to_cpu(hdr->header.ucode_version);
			
 
				 		ucode_size = le32_to_cpu(hdr->header.ucode_size_bytes);
			
 
				 		ucode_start_address = le32_to_cpu(hdr->ucode_start_addr);
			
@@ -830,6 +835,9 @@ static int amdgpu_cgs_query_system_info(struct cgs_device *cgs_device,
 
				 	case CGS_SYSTEM_INFO_GFX_CU_INFO:
			
 
				 		sys_info->value = adev->gfx.cu_info.number;
			
 
				 		break;
			
 
				+	case CGS_SYSTEM_INFO_GFX_SE_INFO:
			
 
				+		sys_info->value = adev->gfx.config.max_shader_engines;
			
 
				+		break;
			
 
				 	default:
			
 
				 		return -ENODEV;
			
 
				 	}
			
@@ -972,11 +980,11 @@ static int amdgpu_cgs_acpi_eval_object(struct cgs_device *cgs_device,
 
				 				params->integer.value = argument->value;
			
 
				 				break;
			
 
				 			case ACPI_TYPE_STRING:
			
 
				-				params->string.length = argument->method_length;
			
 
				+				params->string.length = argument->data_length;
			
 
				 				params->string.pointer = argument->pointer;
			
 
				 				break;
			
 
				 			case ACPI_TYPE_BUFFER:
			
 
				-				params->buffer.length = argument->method_length;
			
 
				+				params->buffer.length = argument->data_length;
			
 
				 				params->buffer.pointer = argument->pointer;
			
 
				 				break;
			
 
				 			default:
			
@@ -1079,17 +1087,14 @@ int amdgpu_cgs_call_acpi_method(struct cgs_device *cgs_device,
 
				 	struct cgs_acpi_method_info info = {0};
			
 
				 
			
 
				 	acpi_input[0].type = CGS_ACPI_TYPE_INTEGER;
			
 
				-	acpi_input[0].method_length = sizeof(uint32_t);
			
 
				 	acpi_input[0].data_length = sizeof(uint32_t);
			
 
				 	acpi_input[0].value = acpi_function;
			
 
				 
			
 
				 	acpi_input[1].type = CGS_ACPI_TYPE_BUFFER;
			
 
				-	acpi_input[1].method_length = CGS_ACPI_MAX_BUFFER_SIZE;
			
 
				 	acpi_input[1].data_length = input_size;
			
 
				 	acpi_input[1].pointer = pinput;
			
 
				 
			
 
				 	acpi_output.type = CGS_ACPI_TYPE_BUFFER;
			
 
				-	acpi_output.method_length = CGS_ACPI_MAX_BUFFER_SIZE;
			
 
				 	acpi_output.data_length = output_size;
			
 
				 	acpi_output.pointer = poutput;
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_connectors.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_connectors.c
@@ -1690,7 +1690,6 @@ amdgpu_connector_add(struct amdgpu_device *adev,
 
				 						   DRM_MODE_SCALE_NONE);
			
 
				 			/* no HPD on analog connectors */
			
 
				 			amdgpu_connector->hpd.hpd = AMDGPU_HPD_NONE;
			
 
				-			connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				 			connector->interlace_allowed = true;
			
 
				 			connector->doublescan_allowed = true;
			
 
				 			break;
			
@@ -1893,8 +1892,10 @@ amdgpu_connector_add(struct amdgpu_device *adev,
 
				 	}
			
 
				 
			
 
				 	if (amdgpu_connector->hpd.hpd == AMDGPU_HPD_NONE) {
			
 
				-		if (i2c_bus->valid)
			
 
				-			connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				+		if (i2c_bus->valid) {
			
 
				+			connector->polled = DRM_CONNECTOR_POLL_CONNECT |
			
 
				+			                    DRM_CONNECTOR_POLL_DISCONNECT;
			
 
				+		}
			
 
				 	} else
			
 
				 		connector->polled = DRM_CONNECTOR_POLL_HPD;
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
@@ -216,11 +216,8 @@ int amdgpu_cs_parser_init(struct amdgpu_cs_parser *p, void *data)
 
				 	if (ret)
			
 
				 		goto free_all_kdata;
			
 
				 
			
 
				-	if (p->uf_entry.robj) {
			
 
				-		p->job->uf_bo = amdgpu_bo_ref(p->uf_entry.robj);
			
 
				-		p->job->uf_offset = uf_offset;
			
 
				-	}
			
 
				-
			
 
				+	if (p->uf_entry.robj)
			
 
				+		p->job->uf_addr = uf_offset;
			
 
				 	kfree(chunk_array);
			
 
				 	return 0;
			
 
				 
			
@@ -459,7 +456,7 @@ static int amdgpu_cs_parser_bos(struct amdgpu_cs_parser *p,
 
				 		list_splice(&need_pages, &p->validated);
			
 
				 	}
			
 
				 
			
 
				-	amdgpu_vm_get_pt_bos(&fpriv->vm, &duplicates);
			
 
				+	amdgpu_vm_get_pt_bos(p->adev, &fpriv->vm, &duplicates);
			
 
				 
			
 
				 	p->bytes_moved_threshold = amdgpu_cs_get_threshold_for_moves(p->adev);
			
 
				 	p->bytes_moved = 0;
			
@@ -472,6 +469,9 @@ static int amdgpu_cs_parser_bos(struct amdgpu_cs_parser *p,
 
				 	if (r)
			
 
				 		goto error_validate;
			
 
				 
			
 
				+	fpriv->vm.last_eviction_counter =
			
 
				+		atomic64_read(&p->adev->num_evictions);
			
 
				+
			
 
				 	if (p->bo_list) {
			
 
				 		struct amdgpu_bo *gds = p->bo_list->gds_obj;
			
 
				 		struct amdgpu_bo *gws = p->bo_list->gws_obj;
			
@@ -499,6 +499,9 @@ static int amdgpu_cs_parser_bos(struct amdgpu_cs_parser *p,
 
				 		}
			
 
				 	}
			
 
				 
			
 
				+	if (p->uf_entry.robj)
			
 
				+		p->job->uf_addr += amdgpu_bo_gpu_offset(p->uf_entry.robj);
			
 
				+
			
 
				 error_validate:
			
 
				 	if (r) {
			
 
				 		amdgpu_vm_move_pt_bos_in_lru(p->adev, &fpriv->vm);
			
@@ -653,18 +656,21 @@ static int amdgpu_cs_ib_vm_chunk(struct amdgpu_device *adev,
 
				 
			
 
				 	/* Only for UVD/VCE VM emulation */
			
 
				 	if (ring->funcs->parse_cs) {
			
 
				+		p->job->vm = NULL;
			
 
				 		for (i = 0; i < p->job->num_ibs; i++) {
			
 
				 			r = amdgpu_ring_parse_cs(ring, p, i);
			
 
				 			if (r)
			
 
				 				return r;
			
 
				 		}
			
 
				-	}
			
 
				+	} else {
			
 
				+		p->job->vm_pd_addr = amdgpu_bo_gpu_offset(vm->page_directory);
			
 
				 
			
 
				-	r = amdgpu_bo_vm_update_pte(p, vm);
			
 
				-	if (!r)
			
 
				-		amdgpu_cs_sync_rings(p);
			
 
				+		r = amdgpu_bo_vm_update_pte(p, vm);
			
 
				+		if (r)
			
 
				+			return r;
			
 
				+	}
			
 
				 
			
 
				-	return r;
			
 
				+	return amdgpu_cs_sync_rings(p);
			
 
				 }
			
 
				 
			
 
				 static int amdgpu_cs_handle_lockup(struct amdgpu_device *adev, int r)
			
@@ -761,7 +767,7 @@ static int amdgpu_cs_ib_fill(struct amdgpu_device *adev,
 
				 	}
			
 
				 
			
 
				 	/* UVD & VCE fw doesn't support user fences */
			
 
				-	if (parser->job->uf_bo && (
			
 
				+	if (parser->job->uf_addr && (
			
 
				 	    parser->job->ring->type == AMDGPU_RING_TYPE_UVD ||
			
 
				 	    parser->job->ring->type == AMDGPU_RING_TYPE_VCE))
			
 
				 		return -EINVAL;
			
@@ -830,17 +836,13 @@ static int amdgpu_cs_submit(struct amdgpu_cs_parser *p,
 
				 {
			
 
				 	struct amdgpu_ring *ring = p->job->ring;
			
 
				 	struct amd_sched_entity *entity = &p->ctx->rings[ring->idx].entity;
			
 
				-	struct fence *fence;
			
 
				 	struct amdgpu_job *job;
			
 
				 	int r;
			
 
				 
			
 
				 	job = p->job;
			
 
				 	p->job = NULL;
			
 
				 
			
 
				-	r = amd_sched_job_init(&job->base, &ring->sched,
			
 
				-			       entity, amdgpu_job_timeout_func,
			
 
				-			       amdgpu_job_free_func,
			
 
				-			       p->filp, &fence);
			
 
				+	r = amd_sched_job_init(&job->base, &ring->sched, entity, p->filp);
			
 
				 	if (r) {
			
 
				 		amdgpu_job_free(job);
			
 
				 		return r;
			
@@ -848,9 +850,10 @@ static int amdgpu_cs_submit(struct amdgpu_cs_parser *p,
 
				 
			
 
				 	job->owner = p->filp;
			
 
				 	job->ctx = entity->fence_context;
			
 
				-	p->fence = fence_get(fence);
			
 
				-	cs->out.handle = amdgpu_ctx_add_fence(p->ctx, ring, fence);
			
 
				+	p->fence = fence_get(&job->base.s_fence->finished);
			
 
				+	cs->out.handle = amdgpu_ctx_add_fence(p->ctx, ring, p->fence);
			
 
				 	job->uf_sequence = cs->out.handle;
			
 
				+	amdgpu_job_free_resources(job);
			
 
				 
			
 
				 	trace_amdgpu_cs_ioctl(job);
			
 
				 	amd_sched_entity_push_job(&job->base);
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
@@ -25,6 +25,7 @@
 
				  *          Alex Deucher
			
 
				  *          Jerome Glisse
			
 
				  */
			
 
				+#include <linux/kthread.h>
			
 
				 #include <linux/console.h>
			
 
				 #include <linux/slab.h>
			
 
				 #include <linux/debugfs.h>
			
@@ -35,6 +36,7 @@
 
				 #include <linux/vga_switcheroo.h>
			
 
				 #include <linux/efi.h>
			
 
				 #include "amdgpu.h"
			
 
				+#include "amdgpu_trace.h"
			
 
				 #include "amdgpu_i2c.h"
			
 
				 #include "atom.h"
			
 
				 #include "amdgpu_atombios.h"
			
@@ -79,24 +81,27 @@ bool amdgpu_device_is_px(struct drm_device *dev)
 
				 uint32_t amdgpu_mm_rreg(struct amdgpu_device *adev, uint32_t reg,
			
 
				 			bool always_indirect)
			
 
				 {
			
 
				+	uint32_t ret;
			
 
				+
			
 
				 	if ((reg * 4) < adev->rmmio_size && !always_indirect)
			
 
				-		return readl(((void __iomem *)adev->rmmio) + (reg * 4));
			
 
				+		ret = readl(((void __iomem *)adev->rmmio) + (reg * 4));
			
 
				 	else {
			
 
				 		unsigned long flags;
			
 
				-		uint32_t ret;
			
 
				 
			
 
				 		spin_lock_irqsave(&adev->mmio_idx_lock, flags);
			
 
				 		writel((reg * 4), ((void __iomem *)adev->rmmio) + (mmMM_INDEX * 4));
			
 
				 		ret = readl(((void __iomem *)adev->rmmio) + (mmMM_DATA * 4));
			
 
				 		spin_unlock_irqrestore(&adev->mmio_idx_lock, flags);
			
 
				-
			
 
				-		return ret;
			
 
				 	}
			
 
				+	trace_amdgpu_mm_rreg(adev->pdev->device, reg, ret);
			
 
				+	return ret;
			
 
				 }
			
 
				 
			
 
				 void amdgpu_mm_wreg(struct amdgpu_device *adev, uint32_t reg, uint32_t v,
			
 
				 		    bool always_indirect)
			
 
				 {
			
 
				+	trace_amdgpu_mm_wreg(adev->pdev->device, reg, v);
			
 
				+	
			
 
				 	if ((reg * 4) < adev->rmmio_size && !always_indirect)
			
 
				 		writel(v, ((void __iomem *)adev->rmmio) + (reg * 4));
			
 
				 	else {
			
@@ -1070,11 +1075,14 @@ int amdgpu_set_clockgating_state(struct amdgpu_device *adev,
 
				 	int i, r = 0;
			
 
				 
			
 
				 	for (i = 0; i < adev->num_ip_blocks; i++) {
			
 
				+		if (!adev->ip_block_status[i].valid)
			
 
				+			continue;
			
 
				 		if (adev->ip_blocks[i].type == block_type) {
			
 
				 			r = adev->ip_blocks[i].funcs->set_clockgating_state((void *)adev,
			
 
				 									    state);
			
 
				 			if (r)
			
 
				 				return r;
			
 
				+			break;
			
 
				 		}
			
 
				 	}
			
 
				 	return r;
			
@@ -1087,16 +1095,53 @@ int amdgpu_set_powergating_state(struct amdgpu_device *adev,
 
				 	int i, r = 0;
			
 
				 
			
 
				 	for (i = 0; i < adev->num_ip_blocks; i++) {
			
 
				+		if (!adev->ip_block_status[i].valid)
			
 
				+			continue;
			
 
				 		if (adev->ip_blocks[i].type == block_type) {
			
 
				 			r = adev->ip_blocks[i].funcs->set_powergating_state((void *)adev,
			
 
				 									    state);
			
 
				 			if (r)
			
 
				 				return r;
			
 
				+			break;
			
 
				 		}
			
 
				 	}
			
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				+int amdgpu_wait_for_idle(struct amdgpu_device *adev,
			
 
				+			 enum amd_ip_block_type block_type)
			
 
				+{
			
 
				+	int i, r;
			
 
				+
			
 
				+	for (i = 0; i < adev->num_ip_blocks; i++) {
			
 
				+		if (!adev->ip_block_status[i].valid)
			
 
				+			continue;
			
 
				+		if (adev->ip_blocks[i].type == block_type) {
			
 
				+			r = adev->ip_blocks[i].funcs->wait_for_idle((void *)adev);
			
 
				+			if (r)
			
 
				+				return r;
			
 
				+			break;
			
 
				+		}
			
 
				+	}
			
 
				+	return 0;
			
 
				+
			
 
				+}
			
 
				+
			
 
				+bool amdgpu_is_idle(struct amdgpu_device *adev,
			
 
				+		    enum amd_ip_block_type block_type)
			
 
				+{
			
 
				+	int i;
			
 
				+
			
 
				+	for (i = 0; i < adev->num_ip_blocks; i++) {
			
 
				+		if (!adev->ip_block_status[i].valid)
			
 
				+			continue;
			
 
				+		if (adev->ip_blocks[i].type == block_type)
			
 
				+			return adev->ip_blocks[i].funcs->is_idle((void *)adev);
			
 
				+	}
			
 
				+	return true;
			
 
				+
			
 
				+}
			
 
				+
			
 
				 const struct amdgpu_ip_block_version * amdgpu_get_ip_block(
			
 
				 					struct amdgpu_device *adev,
			
 
				 					enum amd_ip_block_type type)
			
@@ -1209,6 +1254,9 @@ static int amdgpu_early_init(struct amdgpu_device *adev)
 
				 		}
			
 
				 	}
			
 
				 
			
 
				+	adev->cg_flags &= amdgpu_cg_mask;
			
 
				+	adev->pg_flags &= amdgpu_pg_mask;
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -1440,9 +1488,12 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	adev->uvd_ctx_wreg = &amdgpu_invalid_wreg;
			
 
				 	adev->didt_rreg = &amdgpu_invalid_rreg;
			
 
				 	adev->didt_wreg = &amdgpu_invalid_wreg;
			
 
				+	adev->gc_cac_rreg = &amdgpu_invalid_rreg;
			
 
				+	adev->gc_cac_wreg = &amdgpu_invalid_wreg;
			
 
				 	adev->audio_endpt_rreg = &amdgpu_block_invalid_rreg;
			
 
				 	adev->audio_endpt_wreg = &amdgpu_block_invalid_wreg;
			
 
				 
			
 
				+
			
 
				 	DRM_INFO("initializing kernel modesetting (%s 0x%04X:0x%04X 0x%04X:0x%04X 0x%02X).\n",
			
 
				 		 amdgpu_asic_name[adev->asic_type], pdev->vendor, pdev->device,
			
 
				 		 pdev->subsystem_vendor, pdev->subsystem_device, pdev->revision);
			
@@ -1467,6 +1518,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	spin_lock_init(&adev->pcie_idx_lock);
			
 
				 	spin_lock_init(&adev->uvd_ctx_idx_lock);
			
 
				 	spin_lock_init(&adev->didt_idx_lock);
			
 
				+	spin_lock_init(&adev->gc_cac_idx_lock);
			
 
				 	spin_lock_init(&adev->audio_endpt_idx_lock);
			
 
				 
			
 
				 	adev->rmmio_base = pci_resource_start(adev->pdev, 5);
			
@@ -1511,17 +1563,20 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 		vga_switcheroo_init_domain_pm_ops(adev->dev, &adev->vga_pm_domain);
			
 
				 
			
 
				 	/* Read BIOS */
			
 
				-	if (!amdgpu_get_bios(adev))
			
 
				-		return -EINVAL;
			
 
				+	if (!amdgpu_get_bios(adev)) {
			
 
				+		r = -EINVAL;
			
 
				+		goto failed;
			
 
				+	}
			
 
				 	/* Must be an ATOMBIOS */
			
 
				 	if (!adev->is_atom_bios) {
			
 
				 		dev_err(adev->dev, "Expecting atombios for GPU\n");
			
 
				-		return -EINVAL;
			
 
				+		r = -EINVAL;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 	r = amdgpu_atombios_init(adev);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "amdgpu_atombios_init failed\n");
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 
			
 
				 	/* See if the asic supports SR-IOV */
			
@@ -1538,7 +1593,8 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	     !(adev->virtualization.caps & AMDGPU_VIRT_CAPS_SRIOV_EN))) {
			
 
				 		if (!adev->bios) {
			
 
				 			dev_err(adev->dev, "Card not posted and no BIOS - ignoring\n");
			
 
				-			return -EINVAL;
			
 
				+			r = -EINVAL;
			
 
				+			goto failed;
			
 
				 		}
			
 
				 		DRM_INFO("GPU not posted. posting now...\n");
			
 
				 		amdgpu_atom_asic_init(adev->mode_info.atom_context);
			
@@ -1548,7 +1604,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	r = amdgpu_atombios_get_clock_info(adev);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "amdgpu_atombios_get_clock_info failed\n");
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 	/* init i2c buses */
			
 
				 	amdgpu_atombios_i2c_init(adev);
			
@@ -1557,7 +1613,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	r = amdgpu_fence_driver_init(adev);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "amdgpu_fence_driver_init failed\n");
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 
			
 
				 	/* init the mode config */
			
@@ -1567,7 +1623,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "amdgpu_init failed\n");
			
 
				 		amdgpu_fini(adev);
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 
			
 
				 	adev->accel_working = true;
			
@@ -1577,7 +1633,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	r = amdgpu_ib_pool_init(adev);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "IB initialization failed (%d).\n", r);
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 
			
 
				 	r = amdgpu_ib_ring_tests(adev);
			
@@ -1594,6 +1650,12 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 		DRM_ERROR("registering register debugfs failed (%d).\n", r);
			
 
				 	}
			
 
				 
			
 
				+	r = amdgpu_debugfs_firmware_init(adev);
			
 
				+	if (r) {
			
 
				+		DRM_ERROR("registering firmware debugfs failed (%d).\n", r);
			
 
				+		return r;
			
 
				+	}
			
 
				+
			
 
				 	if ((amdgpu_testing & 1)) {
			
 
				 		if (adev->accel_working)
			
 
				 			amdgpu_test_moves(adev);
			
@@ -1619,10 +1681,15 @@ int amdgpu_device_init(struct amdgpu_device *adev,
 
				 	r = amdgpu_late_init(adev);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "amdgpu_late_init failed\n");
			
 
				-		return r;
			
 
				+		goto failed;
			
 
				 	}
			
 
				 
			
 
				 	return 0;
			
 
				+
			
 
				+failed:
			
 
				+	if (runtime)
			
 
				+		vga_switcheroo_fini_domain_pm_ops(adev->dev);
			
 
				+	return r;
			
 
				 }
			
 
				 
			
 
				 static void amdgpu_debugfs_remove_files(struct amdgpu_device *adev);
			
@@ -1656,6 +1723,8 @@ void amdgpu_device_fini(struct amdgpu_device *adev)
 
				 	kfree(adev->bios);
			
 
				 	adev->bios = NULL;
			
 
				 	vga_switcheroo_unregister_client(adev->pdev);
			
 
				+	if (adev->flags & AMD_IS_PX)
			
 
				+		vga_switcheroo_fini_domain_pm_ops(adev->dev);
			
 
				 	vga_client_register(adev->pdev, NULL, NULL, NULL);
			
 
				 	if (adev->rio_mem)
			
 
				 		pci_iounmap(adev->pdev, adev->rio_mem);
			
@@ -1861,11 +1930,6 @@ int amdgpu_resume_kms(struct drm_device *dev, bool resume, bool fbcon)
 
				  */
			
 
				 int amdgpu_gpu_reset(struct amdgpu_device *adev)
			
 
				 {
			
 
				-	unsigned ring_sizes[AMDGPU_MAX_RINGS];
			
 
				-	uint32_t *ring_data[AMDGPU_MAX_RINGS];
			
 
				-
			
 
				-	bool saved = false;
			
 
				-
			
 
				 	int i, r;
			
 
				 	int resched;
			
 
				 
			
@@ -1874,22 +1938,30 @@ int amdgpu_gpu_reset(struct amdgpu_device *adev)
 
				 	/* block TTM */
			
 
				 	resched = ttm_bo_lock_delayed_workqueue(&adev->mman.bdev);
			
 
				 
			
 
				-	r = amdgpu_suspend(adev);
			
 
				-
			
 
				+	/* block scheduler */
			
 
				 	for (i = 0; i < AMDGPU_MAX_RINGS; ++i) {
			
 
				 		struct amdgpu_ring *ring = adev->rings[i];
			
 
				+
			
 
				 		if (!ring)
			
 
				 			continue;
			
 
				-
			
 
				-		ring_sizes[i] = amdgpu_ring_backup(ring, &ring_data[i]);
			
 
				-		if (ring_sizes[i]) {
			
 
				-			saved = true;
			
 
				-			dev_info(adev->dev, "Saved %d dwords of commands "
			
 
				-				 "on ring %d.\n", ring_sizes[i], i);
			
 
				-		}
			
 
				+		kthread_park(ring->sched.thread);
			
 
				+		amd_sched_hw_job_reset(&ring->sched);
			
 
				 	}
			
 
				+	/* after all hw jobs are reset, hw fence is meaningless, so force_completion */
			
 
				+	amdgpu_fence_driver_force_completion(adev);
			
 
				+
			
 
				+	/* save scratch */
			
 
				+	amdgpu_atombios_scratch_regs_save(adev);
			
 
				+	r = amdgpu_suspend(adev);
			
 
				 
			
 
				 retry:
			
 
				+	/* Disable fb access */
			
 
				+	if (adev->mode_info.num_crtc) {
			
 
				+		struct amdgpu_mode_mc_save save;
			
 
				+		amdgpu_display_stop_mc_access(adev, &save);
			
 
				+		amdgpu_wait_for_idle(adev, AMD_IP_BLOCK_TYPE_GMC);
			
 
				+	}
			
 
				+
			
 
				 	r = amdgpu_asic_reset(adev);
			
 
				 	/* post card */
			
 
				 	amdgpu_atom_asic_init(adev->mode_info.atom_context);
			
@@ -1898,32 +1970,29 @@ retry:
 
				 		dev_info(adev->dev, "GPU reset succeeded, trying to resume\n");
			
 
				 		r = amdgpu_resume(adev);
			
 
				 	}
			
 
				-
			
 
				+	/* restore scratch */
			
 
				+	amdgpu_atombios_scratch_regs_restore(adev);
			
 
				 	if (!r) {
			
 
				+		r = amdgpu_ib_ring_tests(adev);
			
 
				+		if (r) {
			
 
				+			dev_err(adev->dev, "ib ring test failed (%d).\n", r);
			
 
				+			r = amdgpu_suspend(adev);
			
 
				+			goto retry;
			
 
				+		}
			
 
				+
			
 
				 		for (i = 0; i < AMDGPU_MAX_RINGS; ++i) {
			
 
				 			struct amdgpu_ring *ring = adev->rings[i];
			
 
				 			if (!ring)
			
 
				 				continue;
			
 
				-
			
 
				-			amdgpu_ring_restore(ring, ring_sizes[i], ring_data[i]);
			
 
				-			ring_sizes[i] = 0;
			
 
				-			ring_data[i] = NULL;
			
 
				-		}
			
 
				-
			
 
				-		r = amdgpu_ib_ring_tests(adev);
			
 
				-		if (r) {
			
 
				-			dev_err(adev->dev, "ib ring test failed (%d).\n", r);
			
 
				-			if (saved) {
			
 
				-				saved = false;
			
 
				-				r = amdgpu_suspend(adev);
			
 
				-				goto retry;
			
 
				-			}
			
 
				+			amd_sched_job_recovery(&ring->sched);
			
 
				+			kthread_unpark(ring->sched.thread);
			
 
				 		}
			
 
				 	} else {
			
 
				-		amdgpu_fence_driver_force_completion(adev);
			
 
				+		dev_err(adev->dev, "asic resume failed (%d).\n", r);
			
 
				 		for (i = 0; i < AMDGPU_MAX_RINGS; ++i) {
			
 
				-			if (adev->rings[i])
			
 
				-				kfree(ring_data[i]);
			
 
				+			if (adev->rings[i]) {
			
 
				+				kthread_unpark(adev->rings[i]->sched.thread);
			
 
				+			}
			
 
				 		}
			
 
				 	}
			
 
				 
			
@@ -1934,13 +2003,11 @@ retry:
 
				 		/* bad news, how to tell it to userspace ? */
			
 
				 		dev_info(adev->dev, "GPU reset failed\n");
			
 
				 	}
			
 
				+	amdgpu_irq_gpu_reset_resume_helper(adev);
			
 
				 
			
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				-#define AMDGPU_DEFAULT_PCIE_GEN_MASK 0x30007  /* gen: chipset 1/2, asic 1/2/3 */
			
 
				-#define AMDGPU_DEFAULT_PCIE_MLW_MASK 0x2f0000 /* 1/2/4/8/16 lanes */
			
 
				-
			
 
				 void amdgpu_get_pcie_info(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 mask;
			
@@ -2094,20 +2161,43 @@ static ssize_t amdgpu_debugfs_regs_read(struct file *f, char __user *buf,
 
				 	struct amdgpu_device *adev = f->f_inode->i_private;
			
 
				 	ssize_t result = 0;
			
 
				 	int r;
			
 
				+	bool use_bank;
			
 
				+	unsigned instance_bank, sh_bank, se_bank;
			
 
				 
			
 
				 	if (size & 0x3 || *pos & 0x3)
			
 
				 		return -EINVAL;
			
 
				 
			
 
				+	if (*pos & (1ULL << 62)) {
			
 
				+		se_bank = (*pos >> 24) & 0x3FF;
			
 
				+		sh_bank = (*pos >> 34) & 0x3FF;
			
 
				+		instance_bank = (*pos >> 44) & 0x3FF;
			
 
				+		use_bank = 1;
			
 
				+		*pos &= 0xFFFFFF;
			
 
				+	} else {
			
 
				+		use_bank = 0;
			
 
				+	}
			
 
				+
			
 
				+	if (use_bank) {
			
 
				+		if (sh_bank >= adev->gfx.config.max_sh_per_se ||
			
 
				+		    se_bank >= adev->gfx.config.max_shader_engines)
			
 
				+			return -EINVAL;
			
 
				+		mutex_lock(&adev->grbm_idx_mutex);
			
 
				+		amdgpu_gfx_select_se_sh(adev, se_bank,
			
 
				+					sh_bank, instance_bank);
			
 
				+	}
			
 
				+
			
 
				 	while (size) {
			
 
				 		uint32_t value;
			
 
				 
			
 
				 		if (*pos > adev->rmmio_size)
			
 
				-			return result;
			
 
				+			goto end;
			
 
				 
			
 
				 		value = RREG32(*pos >> 2);
			
 
				 		r = put_user(value, (uint32_t *)buf);
			
 
				-		if (r)
			
 
				-			return r;
			
 
				+		if (r) {
			
 
				+			result = r;
			
 
				+			goto end;
			
 
				+		}
			
 
				 
			
 
				 		result += 4;
			
 
				 		buf += 4;
			
@@ -2115,6 +2205,12 @@ static ssize_t amdgpu_debugfs_regs_read(struct file *f, char __user *buf,
 
				 		size -= 4;
			
 
				 	}
			
 
				 
			
 
				+end:
			
 
				+	if (use_bank) {
			
 
				+		amdgpu_gfx_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				+		mutex_unlock(&adev->grbm_idx_mutex);
			
 
				+	}
			
 
				+
			
 
				 	return result;
			
 
				 }
			
 
				 
			
@@ -2314,6 +2410,68 @@ static ssize_t amdgpu_debugfs_regs_smc_write(struct file *f, const char __user *
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+static ssize_t amdgpu_debugfs_gca_config_read(struct file *f, char __user *buf,
			
 
				+					size_t size, loff_t *pos)
			
 
				+{
			
 
				+	struct amdgpu_device *adev = f->f_inode->i_private;
			
 
				+	ssize_t result = 0;
			
 
				+	int r;
			
 
				+	uint32_t *config, no_regs = 0;
			
 
				+
			
 
				+	if (size & 0x3 || *pos & 0x3)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	config = kmalloc(256 * sizeof(*config), GFP_KERNEL);
			
 
				+	if (!config)
			
 
				+		return -ENOMEM;
			
 
				+
			
 
				+	/* version, increment each time something is added */
			
 
				+	config[no_regs++] = 0;
			
 
				+	config[no_regs++] = adev->gfx.config.max_shader_engines;
			
 
				+	config[no_regs++] = adev->gfx.config.max_tile_pipes;
			
 
				+	config[no_regs++] = adev->gfx.config.max_cu_per_sh;
			
 
				+	config[no_regs++] = adev->gfx.config.max_sh_per_se;
			
 
				+	config[no_regs++] = adev->gfx.config.max_backends_per_se;
			
 
				+	config[no_regs++] = adev->gfx.config.max_texture_channel_caches;
			
 
				+	config[no_regs++] = adev->gfx.config.max_gprs;
			
 
				+	config[no_regs++] = adev->gfx.config.max_gs_threads;
			
 
				+	config[no_regs++] = adev->gfx.config.max_hw_contexts;
			
 
				+	config[no_regs++] = adev->gfx.config.sc_prim_fifo_size_frontend;
			
 
				+	config[no_regs++] = adev->gfx.config.sc_prim_fifo_size_backend;
			
 
				+	config[no_regs++] = adev->gfx.config.sc_hiz_tile_fifo_size;
			
 
				+	config[no_regs++] = adev->gfx.config.sc_earlyz_tile_fifo_size;
			
 
				+	config[no_regs++] = adev->gfx.config.num_tile_pipes;
			
 
				+	config[no_regs++] = adev->gfx.config.backend_enable_mask;
			
 
				+	config[no_regs++] = adev->gfx.config.mem_max_burst_length_bytes;
			
 
				+	config[no_regs++] = adev->gfx.config.mem_row_size_in_kb;
			
 
				+	config[no_regs++] = adev->gfx.config.shader_engine_tile_size;
			
 
				+	config[no_regs++] = adev->gfx.config.num_gpus;
			
 
				+	config[no_regs++] = adev->gfx.config.multi_gpu_tile_size;
			
 
				+	config[no_regs++] = adev->gfx.config.mc_arb_ramcfg;
			
 
				+	config[no_regs++] = adev->gfx.config.gb_addr_config;
			
 
				+	config[no_regs++] = adev->gfx.config.num_rbs;
			
 
				+
			
 
				+	while (size && (*pos < no_regs * 4)) {
			
 
				+		uint32_t value;
			
 
				+
			
 
				+		value = config[*pos >> 2];
			
 
				+		r = put_user(value, (uint32_t *)buf);
			
 
				+		if (r) {
			
 
				+			kfree(config);
			
 
				+			return r;
			
 
				+		}
			
 
				+
			
 
				+		result += 4;
			
 
				+		buf += 4;
			
 
				+		*pos += 4;
			
 
				+		size -= 4;
			
 
				+	}
			
 
				+
			
 
				+	kfree(config);
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				+
			
 
				 static const struct file_operations amdgpu_debugfs_regs_fops = {
			
 
				 	.owner = THIS_MODULE,
			
 
				 	.read = amdgpu_debugfs_regs_read,
			
@@ -2339,11 +2497,18 @@ static const struct file_operations amdgpu_debugfs_regs_smc_fops = {
 
				 	.llseek = default_llseek
			
 
				 };
			
 
				 
			
 
				+static const struct file_operations amdgpu_debugfs_gca_config_fops = {
			
 
				+	.owner = THIS_MODULE,
			
 
				+	.read = amdgpu_debugfs_gca_config_read,
			
 
				+	.llseek = default_llseek
			
 
				+};
			
 
				+
			
 
				 static const struct file_operations *debugfs_regs[] = {
			
 
				 	&amdgpu_debugfs_regs_fops,
			
 
				 	&amdgpu_debugfs_regs_didt_fops,
			
 
				 	&amdgpu_debugfs_regs_pcie_fops,
			
 
				 	&amdgpu_debugfs_regs_smc_fops,
			
 
				+	&amdgpu_debugfs_gca_config_fops,
			
 
				 };
			
 
				 
			
 
				 static const char *debugfs_regs_names[] = {
			
@@ -2351,6 +2516,7 @@ static const char *debugfs_regs_names[] = {
 
				 	"amdgpu_regs_didt",
			
 
				 	"amdgpu_regs_pcie",
			
 
				 	"amdgpu_regs_smc",
			
 
				+	"amdgpu_gca_config",
			
 
				 };
			
 
				 
			
 
				 static int amdgpu_debugfs_regs_init(struct amdgpu_device *adev)
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_display.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_display.c
@@ -220,19 +220,17 @@ int amdgpu_crtc_page_flip(struct drm_crtc *crtc,
 
				 
			
 
				 	r = amdgpu_bo_pin_restricted(new_rbo, AMDGPU_GEM_DOMAIN_VRAM, 0, 0, &base);
			
 
				 	if (unlikely(r != 0)) {
			
 
				-		amdgpu_bo_unreserve(new_rbo);
			
 
				 		r = -EINVAL;
			
 
				 		DRM_ERROR("failed to pin new rbo buffer before flip\n");
			
 
				-		goto cleanup;
			
 
				+		goto unreserve;
			
 
				 	}
			
 
				 
			
 
				 	r = reservation_object_get_fences_rcu(new_rbo->tbo.resv, &work->excl,
			
 
				 					      &work->shared_count,
			
 
				 					      &work->shared);
			
 
				 	if (unlikely(r != 0)) {
			
 
				-		amdgpu_bo_unreserve(new_rbo);
			
 
				 		DRM_ERROR("failed to get fences for buffer\n");
			
 
				-		goto cleanup;
			
 
				+		goto unpin;
			
 
				 	}
			
 
				 
			
 
				 	amdgpu_bo_get_tiling_flags(new_rbo, &tiling_flags);
			
@@ -275,9 +273,11 @@ pflip_cleanup:
 
				 		DRM_ERROR("failed to reserve new rbo in error path\n");
			
 
				 		goto cleanup;
			
 
				 	}
			
 
				+unpin:
			
 
				 	if (unlikely(amdgpu_bo_unpin(new_rbo) != 0)) {
			
 
				 		DRM_ERROR("failed to unpin new rbo in error path\n");
			
 
				 	}
			
 
				+unreserve:
			
 
				 	amdgpu_bo_unreserve(new_rbo);
			
 
				 
			
 
				 cleanup:
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
@@ -82,8 +82,12 @@ int amdgpu_exp_hw_support = 0;
 
				 int amdgpu_sched_jobs = 32;
			
 
				 int amdgpu_sched_hw_submission = 2;
			
 
				 int amdgpu_powerplay = -1;
			
 
				+int amdgpu_powercontainment = 1;
			
 
				 unsigned amdgpu_pcie_gen_cap = 0;
			
 
				 unsigned amdgpu_pcie_lane_cap = 0;
			
 
				+unsigned amdgpu_cg_mask = 0xffffffff;
			
 
				+unsigned amdgpu_pg_mask = 0xffffffff;
			
 
				+char *amdgpu_disable_cu = NULL;
			
 
				 
			
 
				 MODULE_PARM_DESC(vramlimit, "Restrict VRAM for testing, in megabytes");
			
 
				 module_param_named(vramlimit, amdgpu_vram_limit, int, 0600);
			
@@ -160,6 +164,9 @@ module_param_named(sched_hw_submission, amdgpu_sched_hw_submission, int, 0444);
 
				 #ifdef CONFIG_DRM_AMD_POWERPLAY
			
 
				 MODULE_PARM_DESC(powerplay, "Powerplay component (1 = enable, 0 = disable, -1 = auto (default))");
			
 
				 module_param_named(powerplay, amdgpu_powerplay, int, 0444);
			
 
				+
			
 
				+MODULE_PARM_DESC(powercontainment, "Power Containment (1 = enable (default), 0 = disable)");
			
 
				+module_param_named(powercontainment, amdgpu_powercontainment, int, 0444);
			
 
				 #endif
			
 
				 
			
 
				 MODULE_PARM_DESC(pcie_gen_cap, "PCIE Gen Caps (0: autodetect (default))");
			
@@ -168,6 +175,15 @@ module_param_named(pcie_gen_cap, amdgpu_pcie_gen_cap, uint, 0444);
 
				 MODULE_PARM_DESC(pcie_lane_cap, "PCIE Lane Caps (0: autodetect (default))");
			
 
				 module_param_named(pcie_lane_cap, amdgpu_pcie_lane_cap, uint, 0444);
			
 
				 
			
 
				+MODULE_PARM_DESC(cg_mask, "Clockgating flags mask (0 = disable clock gating)");
			
 
				+module_param_named(cg_mask, amdgpu_cg_mask, uint, 0444);
			
 
				+
			
 
				+MODULE_PARM_DESC(pg_mask, "Powergating flags mask (0 = disable power gating)");
			
 
				+module_param_named(pg_mask, amdgpu_pg_mask, uint, 0444);
			
 
				+
			
 
				+MODULE_PARM_DESC(disable_cu, "Disable CUs (se.sh.cu,...)");
			
 
				+module_param_named(disable_cu, amdgpu_disable_cu, charp, 0444);
			
 
				+
			
 
				 static const struct pci_device_id pciidlist[] = {
			
 
				 #ifdef CONFIG_DRM_AMDGPU_CIK
			
 
				 	/* Kaveri */
			
@@ -413,7 +429,10 @@ static int amdgpu_pmops_runtime_suspend(struct device *dev)
 
				 	pci_save_state(pdev);
			
 
				 	pci_disable_device(pdev);
			
 
				 	pci_ignore_hotplug(pdev);
			
 
				-	pci_set_power_state(pdev, PCI_D3cold);
			
 
				+	if (amdgpu_is_atpx_hybrid())
			
 
				+		pci_set_power_state(pdev, PCI_D3cold);
			
 
				+	else if (!amdgpu_has_atpx_dgpu_power_cntl())
			
 
				+		pci_set_power_state(pdev, PCI_D3hot);
			
 
				 	drm_dev->switch_power_state = DRM_SWITCH_POWER_DYNAMIC_OFF;
			
 
				 
			
 
				 	return 0;
			
@@ -430,7 +449,9 @@ static int amdgpu_pmops_runtime_resume(struct device *dev)
 
				 
			
 
				 	drm_dev->switch_power_state = DRM_SWITCH_POWER_CHANGING;
			
 
				 
			
 
				-	pci_set_power_state(pdev, PCI_D0);
			
 
				+	if (amdgpu_is_atpx_hybrid() ||
			
 
				+	    !amdgpu_has_atpx_dgpu_power_cntl())
			
 
				+		pci_set_power_state(pdev, PCI_D0);
			
 
				 	pci_restore_state(pdev);
			
 
				 	ret = pci_enable_device(pdev);
			
 
				 	if (ret)
			
@@ -515,7 +536,7 @@ static struct drm_driver kms_driver = {
 
				 	.driver_features =
			
 
				 	    DRIVER_USE_AGP |
			
 
				 	    DRIVER_HAVE_IRQ | DRIVER_IRQ_SHARED | DRIVER_GEM |
			
 
				-	    DRIVER_PRIME | DRIVER_RENDER,
			
 
				+	    DRIVER_PRIME | DRIVER_RENDER | DRIVER_MODESET,
			
 
				 	.dev_priv_size = 0,
			
 
				 	.load = amdgpu_driver_load_kms,
			
 
				 	.open = amdgpu_driver_open_kms,
			
@@ -590,7 +611,6 @@ static int __init amdgpu_init(void)
 
				 	DRM_INFO("amdgpu kernel modesetting enabled.\n");
			
 
				 	driver = &kms_driver;
			
 
				 	pdriver = &amdgpu_kms_pci_driver;
			
 
				-	driver->driver_features |= DRIVER_MODESET;
			
 
				 	driver->num_ioctls = amdgpu_max_kms_ioctl;
			
 
				 	amdgpu_register_atpx_handler();
			
 
				 	/* let modprobe override vga console setting */
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_gem.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_gem.c
@@ -503,7 +503,7 @@ static void amdgpu_gem_va_update_vm(struct amdgpu_device *adev,
 
				 	if (r)
			
 
				 		goto error_print;
			
 
				 
			
 
				-	amdgpu_vm_get_pt_bos(bo_va->vm, &duplicates);
			
 
				+	amdgpu_vm_get_pt_bos(adev, bo_va->vm, &duplicates);
			
 
				 	list_for_each_entry(entry, &list, head) {
			
 
				 		domain = amdgpu_mem_type_to_domain(entry->bo->mem.mem_type);
			
 
				 		/* if anything is swapped out don't swap it in here,
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c
@@ -70,3 +70,47 @@ void amdgpu_gfx_scratch_free(struct amdgpu_device *adev, uint32_t reg)
 
				 		}
			
 
				 	}
			
 
				 }
			
 
				+
			
 
				+/**
			
 
				+ * amdgpu_gfx_parse_disable_cu - Parse the disable_cu module parameter
			
 
				+ *
			
 
				+ * @mask: array in which the per-shader array disable masks will be stored
			
 
				+ * @max_se: number of SEs
			
 
				+ * @max_sh: number of SHs
			
 
				+ *
			
 
				+ * The bitmask of CUs to be disabled in the shader array determined by se and
			
 
				+ * sh is stored in mask[se * max_sh + sh].
			
 
				+ */
			
 
				+void amdgpu_gfx_parse_disable_cu(unsigned *mask, unsigned max_se, unsigned max_sh)
			
 
				+{
			
 
				+	unsigned se, sh, cu;
			
 
				+	const char *p;
			
 
				+
			
 
				+	memset(mask, 0, sizeof(*mask) * max_se * max_sh);
			
 
				+
			
 
				+	if (!amdgpu_disable_cu || !*amdgpu_disable_cu)
			
 
				+		return;
			
 
				+
			
 
				+	p = amdgpu_disable_cu;
			
 
				+	for (;;) {
			
 
				+		char *next;
			
 
				+		int ret = sscanf(p, "%u.%u.%u", &se, &sh, &cu);
			
 
				+		if (ret < 3) {
			
 
				+			DRM_ERROR("amdgpu: could not parse disable_cu\n");
			
 
				+			return;
			
 
				+		}
			
 
				+
			
 
				+		if (se < max_se && sh < max_sh && cu < 16) {
			
 
				+			DRM_INFO("amdgpu: disabling CU %u.%u.%u\n", se, sh, cu);
			
 
				+			mask[se * max_sh + sh] |= 1u << cu;
			
 
				+		} else {
			
 
				+			DRM_ERROR("amdgpu: disable_cu %u.%u.%u is out of range\n",
			
 
				+				  se, sh, cu);
			
 
				+		}
			
 
				+
			
 
				+		next = strchr(p, ',');
			
 
				+		if (!next)
			
 
				+			break;
			
 
				+		p = next + 1;
			
 
				+	}
			
 
				+}
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.h
@@ -27,4 +27,6 @@
 
				 int amdgpu_gfx_scratch_get(struct amdgpu_device *adev, uint32_t *reg);
			
 
				 void amdgpu_gfx_scratch_free(struct amdgpu_device *adev, uint32_t reg);
			
 
				 
			
 
				+unsigned amdgpu_gfx_parse_disable_cu(unsigned *mask, unsigned max_se, unsigned max_sh);
			
 
				+
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c
@@ -160,10 +160,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
 
				 		patch_offset = amdgpu_ring_init_cond_exec(ring);
			
 
				 
			
 
				 	if (vm) {
			
 
				-		r = amdgpu_vm_flush(ring, job->vm_id, job->vm_pd_addr,
			
 
				-				    job->gds_base, job->gds_size,
			
 
				-				    job->gws_base, job->gws_size,
			
 
				-				    job->oa_base, job->oa_size);
			
 
				+		r = amdgpu_vm_flush(ring, job);
			
 
				 		if (r) {
			
 
				 			amdgpu_ring_undo(ring);
			
 
				 			return r;
			
@@ -203,11 +200,8 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
 
				 	}
			
 
				 
			
 
				 	/* wrap the last IB with fence */
			
 
				-	if (job && job->uf_bo) {
			
 
				-		uint64_t addr = amdgpu_bo_gpu_offset(job->uf_bo);
			
 
				-
			
 
				-		addr += job->uf_offset;
			
 
				-		amdgpu_ring_emit_fence(ring, addr, job->uf_sequence,
			
 
				+	if (job && job->uf_addr) {
			
 
				+		amdgpu_ring_emit_fence(ring, job->uf_addr, job->uf_sequence,
			
 
				 				       AMDGPU_FENCE_FLAG_64BIT);
			
 
				 	}
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_irq.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_irq.c
@@ -383,6 +383,18 @@ int amdgpu_irq_update(struct amdgpu_device *adev,
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				+void amdgpu_irq_gpu_reset_resume_helper(struct amdgpu_device *adev)
			
 
				+{
			
 
				+	int i, j;
			
 
				+	for (i = 0; i < AMDGPU_MAX_IRQ_SRC_ID; i++) {
			
 
				+		struct amdgpu_irq_src *src = adev->irq.sources[i];
			
 
				+		if (!src)
			
 
				+			continue;
			
 
				+		for (j = 0; j < src->num_types; j++)
			
 
				+			amdgpu_irq_update(adev, src, j);
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * amdgpu_irq_get - enable interrupt
			
 
				  *
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_irq.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_irq.h
@@ -94,6 +94,7 @@ int amdgpu_irq_put(struct amdgpu_device *adev, struct amdgpu_irq_src *src,
 
				 		   unsigned type);
			
 
				 bool amdgpu_irq_enabled(struct amdgpu_device *adev, struct amdgpu_irq_src *src,
			
 
				 			unsigned type);
			
 
				+void amdgpu_irq_gpu_reset_resume_helper(struct amdgpu_device *adev);
			
 
				 
			
 
				 int amdgpu_irq_add_domain(struct amdgpu_device *adev);
			
 
				 void amdgpu_irq_remove_domain(struct amdgpu_device *adev);
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
@@ -28,21 +28,15 @@
 
				 #include "amdgpu.h"
			
 
				 #include "amdgpu_trace.h"
			
 
				 
			
 
				-static void amdgpu_job_free_handler(struct work_struct *ws)
			
 
				+static void amdgpu_job_timedout(struct amd_sched_job *s_job)
			
 
				 {
			
 
				-	struct amdgpu_job *job = container_of(ws, struct amdgpu_job, base.work_free_job);
			
 
				-	amd_sched_job_put(&job->base);
			
 
				-}
			
 
				+	struct amdgpu_job *job = container_of(s_job, struct amdgpu_job, base);
			
 
				 
			
 
				-void amdgpu_job_timeout_func(struct work_struct *work)
			
 
				-{
			
 
				-	struct amdgpu_job *job = container_of(work, struct amdgpu_job, base.work_tdr.work);
			
 
				 	DRM_ERROR("ring %s timeout, last signaled seq=%u, last emitted seq=%u\n",
			
 
				-				job->base.sched->name,
			
 
				-				(uint32_t)atomic_read(&job->ring->fence_drv.last_seq),
			
 
				-				job->ring->fence_drv.sync_seq);
			
 
				-
			
 
				-	amd_sched_job_put(&job->base);
			
 
				+		  job->base.sched->name,
			
 
				+		  atomic_read(&job->ring->fence_drv.last_seq),
			
 
				+		  job->ring->fence_drv.sync_seq);
			
 
				+	amdgpu_gpu_reset(job->adev);
			
 
				 }
			
 
				 
			
 
				 int amdgpu_job_alloc(struct amdgpu_device *adev, unsigned num_ibs,
			
@@ -63,7 +57,6 @@ int amdgpu_job_alloc(struct amdgpu_device *adev, unsigned num_ibs,
 
				 	(*job)->vm = vm;
			
 
				 	(*job)->ibs = (void *)&(*job)[1];
			
 
				 	(*job)->num_ibs = num_ibs;
			
 
				-	INIT_WORK(&(*job)->base.work_free_job, amdgpu_job_free_handler);
			
 
				 
			
 
				 	amdgpu_sync_create(&(*job)->sync);
			
 
				 
			
@@ -86,27 +79,33 @@ int amdgpu_job_alloc_with_ib(struct amdgpu_device *adev, unsigned size,
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				-void amdgpu_job_free(struct amdgpu_job *job)
			
 
				+void amdgpu_job_free_resources(struct amdgpu_job *job)
			
 
				 {
			
 
				-	unsigned i;
			
 
				 	struct fence *f;
			
 
				+	unsigned i;
			
 
				+
			
 
				 	/* use sched fence if available */
			
 
				-	f = (job->base.s_fence)? &job->base.s_fence->base : job->fence;
			
 
				+	f = job->base.s_fence ? &job->base.s_fence->finished : job->fence;
			
 
				 
			
 
				 	for (i = 0; i < job->num_ibs; ++i)
			
 
				-		amdgpu_sa_bo_free(job->adev, &job->ibs[i].sa_bo, f);
			
 
				-	fence_put(job->fence);
			
 
				+		amdgpu_ib_free(job->adev, &job->ibs[i], f);
			
 
				+}
			
 
				 
			
 
				-	amdgpu_bo_unref(&job->uf_bo);
			
 
				-	amdgpu_sync_free(&job->sync);
			
 
				+void amdgpu_job_free_cb(struct amd_sched_job *s_job)
			
 
				+{
			
 
				+	struct amdgpu_job *job = container_of(s_job, struct amdgpu_job, base);
			
 
				 
			
 
				-	if (!job->base.use_sched)
			
 
				-		kfree(job);
			
 
				+	fence_put(job->fence);
			
 
				+	amdgpu_sync_free(&job->sync);
			
 
				+	kfree(job);
			
 
				 }
			
 
				 
			
 
				-void amdgpu_job_free_func(struct kref *refcount)
			
 
				+void amdgpu_job_free(struct amdgpu_job *job)
			
 
				 {
			
 
				-	struct amdgpu_job *job = container_of(refcount, struct amdgpu_job, base.refcount);
			
 
				+	amdgpu_job_free_resources(job);
			
 
				+
			
 
				+	fence_put(job->fence);
			
 
				+	amdgpu_sync_free(&job->sync);
			
 
				 	kfree(job);
			
 
				 }
			
 
				 
			
@@ -114,22 +113,20 @@ int amdgpu_job_submit(struct amdgpu_job *job, struct amdgpu_ring *ring,
 
				 		      struct amd_sched_entity *entity, void *owner,
			
 
				 		      struct fence **f)
			
 
				 {
			
 
				-	struct fence *fence;
			
 
				 	int r;
			
 
				 	job->ring = ring;
			
 
				 
			
 
				 	if (!f)
			
 
				 		return -EINVAL;
			
 
				 
			
 
				-	r = amd_sched_job_init(&job->base, &ring->sched,
			
 
				-			       entity, amdgpu_job_timeout_func,
			
 
				-			       amdgpu_job_free_func, owner, &fence);
			
 
				+	r = amd_sched_job_init(&job->base, &ring->sched, entity, owner);
			
 
				 	if (r)
			
 
				 		return r;
			
 
				 
			
 
				 	job->owner = owner;
			
 
				 	job->ctx = entity->fence_context;
			
 
				-	*f = fence_get(fence);
			
 
				+	*f = fence_get(&job->base.s_fence->finished);
			
 
				+	amdgpu_job_free_resources(job);
			
 
				 	amd_sched_entity_push_job(&job->base);
			
 
				 
			
 
				 	return 0;
			
@@ -147,8 +144,8 @@ static struct fence *amdgpu_job_dependency(struct amd_sched_job *sched_job)
 
				 		int r;
			
 
				 
			
 
				 		r = amdgpu_vm_grab_id(vm, ring, &job->sync,
			
 
				-				      &job->base.s_fence->base,
			
 
				-				      &job->vm_id, &job->vm_pd_addr);
			
 
				+				      &job->base.s_fence->finished,
			
 
				+				      job);
			
 
				 		if (r)
			
 
				 			DRM_ERROR("Error getting VM ID (%d)\n", r);
			
 
				 
			
@@ -170,11 +167,7 @@ static struct fence *amdgpu_job_run(struct amd_sched_job *sched_job)
 
				 	}
			
 
				 	job = to_amdgpu_job(sched_job);
			
 
				 
			
 
				-	r = amdgpu_sync_wait(&job->sync);
			
 
				-	if (r) {
			
 
				-		DRM_ERROR("failed to sync wait (%d)\n", r);
			
 
				-		return NULL;
			
 
				-	}
			
 
				+	BUG_ON(amdgpu_sync_peek_fence(&job->sync, NULL));
			
 
				 
			
 
				 	trace_amdgpu_sched_run_job(job);
			
 
				 	r = amdgpu_ib_schedule(job->ring, job->num_ibs, job->ibs,
			
@@ -185,14 +178,15 @@ static struct fence *amdgpu_job_run(struct amd_sched_job *sched_job)
 
				 	}
			
 
				 
			
 
				 err:
			
 
				+	/* if gpu reset, hw fence will be replaced here */
			
 
				+	fence_put(job->fence);
			
 
				 	job->fence = fence;
			
 
				-	amdgpu_job_free(job);
			
 
				 	return fence;
			
 
				 }
			
 
				 
			
 
				 const struct amd_sched_backend_ops amdgpu_sched_ops = {
			
 
				 	.dependency = amdgpu_job_dependency,
			
 
				 	.run_job = amdgpu_job_run,
			
 
				-	.begin_job = amd_sched_job_begin,
			
 
				-	.finish_job = amd_sched_job_finish,
			
 
				+	.timedout_job = amdgpu_job_timedout,
			
 
				+	.free_job = amdgpu_job_free_cb
			
 
				 };
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_kms.c
@@ -142,6 +142,65 @@ out:
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				+static int amdgpu_firmware_info(struct drm_amdgpu_info_firmware *fw_info,
			
 
				+				struct drm_amdgpu_query_fw *query_fw,
			
 
				+				struct amdgpu_device *adev)
			
 
				+{
			
 
				+	switch (query_fw->fw_type) {
			
 
				+	case AMDGPU_INFO_FW_VCE:
			
 
				+		fw_info->ver = adev->vce.fw_version;
			
 
				+		fw_info->feature = adev->vce.fb_version;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_UVD:
			
 
				+		fw_info->ver = adev->uvd.fw_version;
			
 
				+		fw_info->feature = 0;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GMC:
			
 
				+		fw_info->ver = adev->mc.fw_version;
			
 
				+		fw_info->feature = 0;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GFX_ME:
			
 
				+		fw_info->ver = adev->gfx.me_fw_version;
			
 
				+		fw_info->feature = adev->gfx.me_feature_version;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GFX_PFP:
			
 
				+		fw_info->ver = adev->gfx.pfp_fw_version;
			
 
				+		fw_info->feature = adev->gfx.pfp_feature_version;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GFX_CE:
			
 
				+		fw_info->ver = adev->gfx.ce_fw_version;
			
 
				+		fw_info->feature = adev->gfx.ce_feature_version;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GFX_RLC:
			
 
				+		fw_info->ver = adev->gfx.rlc_fw_version;
			
 
				+		fw_info->feature = adev->gfx.rlc_feature_version;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_GFX_MEC:
			
 
				+		if (query_fw->index == 0) {
			
 
				+			fw_info->ver = adev->gfx.mec_fw_version;
			
 
				+			fw_info->feature = adev->gfx.mec_feature_version;
			
 
				+		} else if (query_fw->index == 1) {
			
 
				+			fw_info->ver = adev->gfx.mec2_fw_version;
			
 
				+			fw_info->feature = adev->gfx.mec2_feature_version;
			
 
				+		} else
			
 
				+			return -EINVAL;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_SMC:
			
 
				+		fw_info->ver = adev->pm.fw_version;
			
 
				+		fw_info->feature = 0;
			
 
				+		break;
			
 
				+	case AMDGPU_INFO_FW_SDMA:
			
 
				+		if (query_fw->index >= adev->sdma.num_instances)
			
 
				+			return -EINVAL;
			
 
				+		fw_info->ver = adev->sdma.instance[query_fw->index].fw_version;
			
 
				+		fw_info->feature = adev->sdma.instance[query_fw->index].feature_version;
			
 
				+		break;
			
 
				+	default:
			
 
				+		return -EINVAL;
			
 
				+	}
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 /*
			
 
				  * Userspace get information ioctl
			
 
				  */
			
@@ -288,67 +347,20 @@ static int amdgpu_info_ioctl(struct drm_device *dev, void *data, struct drm_file
 
				 		return copy_to_user(out, &count, min(size, 4u)) ? -EFAULT : 0;
			
 
				 	}
			
 
				 	case AMDGPU_INFO_TIMESTAMP:
			
 
				-		ui64 = amdgpu_asic_get_gpu_clock_counter(adev);
			
 
				+		ui64 = amdgpu_gfx_get_gpu_clock_counter(adev);
			
 
				 		return copy_to_user(out, &ui64, min(size, 8u)) ? -EFAULT : 0;
			
 
				 	case AMDGPU_INFO_FW_VERSION: {
			
 
				 		struct drm_amdgpu_info_firmware fw_info;
			
 
				+		int ret;
			
 
				 
			
 
				 		/* We only support one instance of each IP block right now. */
			
 
				 		if (info->query_fw.ip_instance != 0)
			
 
				 			return -EINVAL;
			
 
				 
			
 
				-		switch (info->query_fw.fw_type) {
			
 
				-		case AMDGPU_INFO_FW_VCE:
			
 
				-			fw_info.ver = adev->vce.fw_version;
			
 
				-			fw_info.feature = adev->vce.fb_version;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_UVD:
			
 
				-			fw_info.ver = adev->uvd.fw_version;
			
 
				-			fw_info.feature = 0;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GMC:
			
 
				-			fw_info.ver = adev->mc.fw_version;
			
 
				-			fw_info.feature = 0;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GFX_ME:
			
 
				-			fw_info.ver = adev->gfx.me_fw_version;
			
 
				-			fw_info.feature = adev->gfx.me_feature_version;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GFX_PFP:
			
 
				-			fw_info.ver = adev->gfx.pfp_fw_version;
			
 
				-			fw_info.feature = adev->gfx.pfp_feature_version;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GFX_CE:
			
 
				-			fw_info.ver = adev->gfx.ce_fw_version;
			
 
				-			fw_info.feature = adev->gfx.ce_feature_version;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GFX_RLC:
			
 
				-			fw_info.ver = adev->gfx.rlc_fw_version;
			
 
				-			fw_info.feature = adev->gfx.rlc_feature_version;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_GFX_MEC:
			
 
				-			if (info->query_fw.index == 0) {
			
 
				-				fw_info.ver = adev->gfx.mec_fw_version;
			
 
				-				fw_info.feature = adev->gfx.mec_feature_version;
			
 
				-			} else if (info->query_fw.index == 1) {
			
 
				-				fw_info.ver = adev->gfx.mec2_fw_version;
			
 
				-				fw_info.feature = adev->gfx.mec2_feature_version;
			
 
				-			} else
			
 
				-				return -EINVAL;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_SMC:
			
 
				-			fw_info.ver = adev->pm.fw_version;
			
 
				-			fw_info.feature = 0;
			
 
				-			break;
			
 
				-		case AMDGPU_INFO_FW_SDMA:
			
 
				-			if (info->query_fw.index >= adev->sdma.num_instances)
			
 
				-				return -EINVAL;
			
 
				-			fw_info.ver = adev->sdma.instance[info->query_fw.index].fw_version;
			
 
				-			fw_info.feature = adev->sdma.instance[info->query_fw.index].feature_version;
			
 
				-			break;
			
 
				-		default:
			
 
				-			return -EINVAL;
			
 
				-		}
			
 
				+		ret = amdgpu_firmware_info(&fw_info, &info->query_fw, adev);
			
 
				+		if (ret)
			
 
				+			return ret;
			
 
				+
			
 
				 		return copy_to_user(out, &fw_info,
			
 
				 				    min((size_t)size, sizeof(fw_info))) ? -EFAULT : 0;
			
 
				 	}
			
@@ -756,3 +768,130 @@ const struct drm_ioctl_desc amdgpu_ioctls_kms[] = {
 
				 	DRM_IOCTL_DEF_DRV(AMDGPU_GEM_USERPTR, amdgpu_gem_userptr_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
			
 
				 };
			
 
				 const int amdgpu_max_kms_ioctl = ARRAY_SIZE(amdgpu_ioctls_kms);
			
 
				+
			
 
				+/*
			
 
				+ * Debugfs info
			
 
				+ */
			
 
				+#if defined(CONFIG_DEBUG_FS)
			
 
				+
			
 
				+static int amdgpu_debugfs_firmware_info(struct seq_file *m, void *data)
			
 
				+{
			
 
				+	struct drm_info_node *node = (struct drm_info_node *) m->private;
			
 
				+	struct drm_device *dev = node->minor->dev;
			
 
				+	struct amdgpu_device *adev = dev->dev_private;
			
 
				+	struct drm_amdgpu_info_firmware fw_info;
			
 
				+	struct drm_amdgpu_query_fw query_fw;
			
 
				+	int ret, i;
			
 
				+
			
 
				+	/* VCE */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_VCE;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "VCE feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* UVD */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_UVD;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "UVD feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* GMC */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GMC;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "MC feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* ME */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GFX_ME;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "ME feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* PFP */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GFX_PFP;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "PFP feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* CE */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GFX_CE;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "CE feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* RLC */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GFX_RLC;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "RLC feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* MEC */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_GFX_MEC;
			
 
				+	query_fw.index = 0;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "MEC feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* MEC2 */
			
 
				+	if (adev->asic_type == CHIP_KAVERI ||
			
 
				+	    (adev->asic_type > CHIP_TOPAZ && adev->asic_type != CHIP_STONEY)) {
			
 
				+		query_fw.index = 1;
			
 
				+		ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+		if (ret)
			
 
				+			return ret;
			
 
				+		seq_printf(m, "MEC2 feature version: %u, firmware version: 0x%08x\n",
			
 
				+			   fw_info.feature, fw_info.ver);
			
 
				+	}
			
 
				+
			
 
				+	/* SMC */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_SMC;
			
 
				+	ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+	seq_printf(m, "SMC feature version: %u, firmware version: 0x%08x\n",
			
 
				+		   fw_info.feature, fw_info.ver);
			
 
				+
			
 
				+	/* SDMA */
			
 
				+	query_fw.fw_type = AMDGPU_INFO_FW_SDMA;
			
 
				+	for (i = 0; i < adev->sdma.num_instances; i++) {
			
 
				+		query_fw.index = i;
			
 
				+		ret = amdgpu_firmware_info(&fw_info, &query_fw, adev);
			
 
				+		if (ret)
			
 
				+			return ret;
			
 
				+		seq_printf(m, "SDMA%d feature version: %u, firmware version: 0x%08x\n",
			
 
				+			   i, fw_info.feature, fw_info.ver);
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static const struct drm_info_list amdgpu_firmware_info_list[] = {
			
 
				+	{"amdgpu_firmware_info", amdgpu_debugfs_firmware_info, 0, NULL},
			
 
				+};
			
 
				+#endif
			
 
				+
			
 
				+int amdgpu_debugfs_firmware_init(struct amdgpu_device *adev)
			
 
				+{
			
 
				+#if defined(CONFIG_DEBUG_FS)
			
 
				+	return amdgpu_debugfs_add_files(adev, amdgpu_firmware_info_list,
			
 
				+					ARRAY_SIZE(amdgpu_firmware_info_list));
			
 
				+#else
			
 
				+	return 0;
			
 
				+#endif
			
 
				+}
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_object.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_object.c
@@ -589,6 +589,7 @@ void amdgpu_bo_move_notify(struct ttm_buffer_object *bo,
 
				 			   struct ttm_mem_reg *new_mem)
			
 
				 {
			
 
				 	struct amdgpu_bo *rbo;
			
 
				+	struct ttm_mem_reg *old_mem = &bo->mem;
			
 
				 
			
 
				 	if (!amdgpu_ttm_bo_is_amdgpu_bo(bo))
			
 
				 		return;
			
@@ -602,6 +603,8 @@ void amdgpu_bo_move_notify(struct ttm_buffer_object *bo,
 
				 
			
 
				 	/* move_notify is called before move happens */
			
 
				 	amdgpu_update_memory_usage(rbo->adev, &bo->mem, new_mem);
			
 
				+
			
 
				+	trace_amdgpu_ttm_bo_move(rbo, new_mem->mem_type, old_mem->mem_type);
			
 
				 }
			
 
				 
			
 
				 int amdgpu_bo_fault_reserve_notify(struct ttm_buffer_object *bo)
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_pm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_pm.c
@@ -347,6 +347,8 @@ static ssize_t amdgpu_get_pp_dpm_sclk(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		size = amdgpu_dpm_print_clock_levels(adev, PP_SCLK, buf);
			
 
				+	else if (adev->pm.funcs->print_clock_levels)
			
 
				+		size = adev->pm.funcs->print_clock_levels(adev, PP_SCLK, buf);
			
 
				 
			
 
				 	return size;
			
 
				 }
			
@@ -363,7 +365,9 @@ static ssize_t amdgpu_set_pp_dpm_sclk(struct device *dev,
 
				 	uint32_t i, mask = 0;
			
 
				 	char sub_str[2];
			
 
				 
			
 
				-	for (i = 0; i < strlen(buf) - 1; i++) {
			
 
				+	for (i = 0; i < strlen(buf); i++) {
			
 
				+		if (*(buf + i) == '\n')
			
 
				+			continue;
			
 
				 		sub_str[0] = *(buf + i);
			
 
				 		sub_str[1] = '\0';
			
 
				 		ret = kstrtol(sub_str, 0, &level);
			
@@ -377,6 +381,8 @@ static ssize_t amdgpu_set_pp_dpm_sclk(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		amdgpu_dpm_force_clock_level(adev, PP_SCLK, mask);
			
 
				+	else if (adev->pm.funcs->force_clock_level)
			
 
				+		adev->pm.funcs->force_clock_level(adev, PP_SCLK, mask);
			
 
				 fail:
			
 
				 	return count;
			
 
				 }
			
@@ -391,6 +397,8 @@ static ssize_t amdgpu_get_pp_dpm_mclk(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		size = amdgpu_dpm_print_clock_levels(adev, PP_MCLK, buf);
			
 
				+	else if (adev->pm.funcs->print_clock_levels)
			
 
				+		size = adev->pm.funcs->print_clock_levels(adev, PP_MCLK, buf);
			
 
				 
			
 
				 	return size;
			
 
				 }
			
@@ -407,7 +415,9 @@ static ssize_t amdgpu_set_pp_dpm_mclk(struct device *dev,
 
				 	uint32_t i, mask = 0;
			
 
				 	char sub_str[2];
			
 
				 
			
 
				-	for (i = 0; i < strlen(buf) - 1; i++) {
			
 
				+	for (i = 0; i < strlen(buf); i++) {
			
 
				+		if (*(buf + i) == '\n')
			
 
				+			continue;
			
 
				 		sub_str[0] = *(buf + i);
			
 
				 		sub_str[1] = '\0';
			
 
				 		ret = kstrtol(sub_str, 0, &level);
			
@@ -421,6 +431,8 @@ static ssize_t amdgpu_set_pp_dpm_mclk(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		amdgpu_dpm_force_clock_level(adev, PP_MCLK, mask);
			
 
				+	else if (adev->pm.funcs->force_clock_level)
			
 
				+		adev->pm.funcs->force_clock_level(adev, PP_MCLK, mask);
			
 
				 fail:
			
 
				 	return count;
			
 
				 }
			
@@ -435,6 +447,8 @@ static ssize_t amdgpu_get_pp_dpm_pcie(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		size = amdgpu_dpm_print_clock_levels(adev, PP_PCIE, buf);
			
 
				+	else if (adev->pm.funcs->print_clock_levels)
			
 
				+		size = adev->pm.funcs->print_clock_levels(adev, PP_PCIE, buf);
			
 
				 
			
 
				 	return size;
			
 
				 }
			
@@ -451,7 +465,9 @@ static ssize_t amdgpu_set_pp_dpm_pcie(struct device *dev,
 
				 	uint32_t i, mask = 0;
			
 
				 	char sub_str[2];
			
 
				 
			
 
				-	for (i = 0; i < strlen(buf) - 1; i++) {
			
 
				+	for (i = 0; i < strlen(buf); i++) {
			
 
				+		if (*(buf + i) == '\n')
			
 
				+			continue;
			
 
				 		sub_str[0] = *(buf + i);
			
 
				 		sub_str[1] = '\0';
			
 
				 		ret = kstrtol(sub_str, 0, &level);
			
@@ -465,6 +481,100 @@ static ssize_t amdgpu_set_pp_dpm_pcie(struct device *dev,
 
				 
			
 
				 	if (adev->pp_enabled)
			
 
				 		amdgpu_dpm_force_clock_level(adev, PP_PCIE, mask);
			
 
				+	else if (adev->pm.funcs->force_clock_level)
			
 
				+		adev->pm.funcs->force_clock_level(adev, PP_PCIE, mask);
			
 
				+fail:
			
 
				+	return count;
			
 
				+}
			
 
				+
			
 
				+static ssize_t amdgpu_get_pp_sclk_od(struct device *dev,
			
 
				+		struct device_attribute *attr,
			
 
				+		char *buf)
			
 
				+{
			
 
				+	struct drm_device *ddev = dev_get_drvdata(dev);
			
 
				+	struct amdgpu_device *adev = ddev->dev_private;
			
 
				+	uint32_t value = 0;
			
 
				+
			
 
				+	if (adev->pp_enabled)
			
 
				+		value = amdgpu_dpm_get_sclk_od(adev);
			
 
				+	else if (adev->pm.funcs->get_sclk_od)
			
 
				+		value = adev->pm.funcs->get_sclk_od(adev);
			
 
				+
			
 
				+	return snprintf(buf, PAGE_SIZE, "%d\n", value);
			
 
				+}
			
 
				+
			
 
				+static ssize_t amdgpu_set_pp_sclk_od(struct device *dev,
			
 
				+		struct device_attribute *attr,
			
 
				+		const char *buf,
			
 
				+		size_t count)
			
 
				+{
			
 
				+	struct drm_device *ddev = dev_get_drvdata(dev);
			
 
				+	struct amdgpu_device *adev = ddev->dev_private;
			
 
				+	int ret;
			
 
				+	long int value;
			
 
				+
			
 
				+	ret = kstrtol(buf, 0, &value);
			
 
				+
			
 
				+	if (ret) {
			
 
				+		count = -EINVAL;
			
 
				+		goto fail;
			
 
				+	}
			
 
				+
			
 
				+	if (adev->pp_enabled) {
			
 
				+		amdgpu_dpm_set_sclk_od(adev, (uint32_t)value);
			
 
				+		amdgpu_dpm_dispatch_task(adev, AMD_PP_EVENT_READJUST_POWER_STATE, NULL, NULL);
			
 
				+	} else if (adev->pm.funcs->set_sclk_od) {
			
 
				+		adev->pm.funcs->set_sclk_od(adev, (uint32_t)value);
			
 
				+		adev->pm.dpm.current_ps = adev->pm.dpm.boot_ps;
			
 
				+		amdgpu_pm_compute_clocks(adev);
			
 
				+	}
			
 
				+
			
 
				+fail:
			
 
				+	return count;
			
 
				+}
			
 
				+
			
 
				+static ssize_t amdgpu_get_pp_mclk_od(struct device *dev,
			
 
				+		struct device_attribute *attr,
			
 
				+		char *buf)
			
 
				+{
			
 
				+	struct drm_device *ddev = dev_get_drvdata(dev);
			
 
				+	struct amdgpu_device *adev = ddev->dev_private;
			
 
				+	uint32_t value = 0;
			
 
				+
			
 
				+	if (adev->pp_enabled)
			
 
				+		value = amdgpu_dpm_get_mclk_od(adev);
			
 
				+	else if (adev->pm.funcs->get_mclk_od)
			
 
				+		value = adev->pm.funcs->get_mclk_od(adev);
			
 
				+
			
 
				+	return snprintf(buf, PAGE_SIZE, "%d\n", value);
			
 
				+}
			
 
				+
			
 
				+static ssize_t amdgpu_set_pp_mclk_od(struct device *dev,
			
 
				+		struct device_attribute *attr,
			
 
				+		const char *buf,
			
 
				+		size_t count)
			
 
				+{
			
 
				+	struct drm_device *ddev = dev_get_drvdata(dev);
			
 
				+	struct amdgpu_device *adev = ddev->dev_private;
			
 
				+	int ret;
			
 
				+	long int value;
			
 
				+
			
 
				+	ret = kstrtol(buf, 0, &value);
			
 
				+
			
 
				+	if (ret) {
			
 
				+		count = -EINVAL;
			
 
				+		goto fail;
			
 
				+	}
			
 
				+
			
 
				+	if (adev->pp_enabled) {
			
 
				+		amdgpu_dpm_set_mclk_od(adev, (uint32_t)value);
			
 
				+		amdgpu_dpm_dispatch_task(adev, AMD_PP_EVENT_READJUST_POWER_STATE, NULL, NULL);
			
 
				+	} else if (adev->pm.funcs->set_mclk_od) {
			
 
				+		adev->pm.funcs->set_mclk_od(adev, (uint32_t)value);
			
 
				+		adev->pm.dpm.current_ps = adev->pm.dpm.boot_ps;
			
 
				+		amdgpu_pm_compute_clocks(adev);
			
 
				+	}
			
 
				+
			
 
				 fail:
			
 
				 	return count;
			
 
				 }
			
@@ -490,6 +600,12 @@ static DEVICE_ATTR(pp_dpm_mclk, S_IRUGO | S_IWUSR,
 
				 static DEVICE_ATTR(pp_dpm_pcie, S_IRUGO | S_IWUSR,
			
 
				 		amdgpu_get_pp_dpm_pcie,
			
 
				 		amdgpu_set_pp_dpm_pcie);
			
 
				+static DEVICE_ATTR(pp_sclk_od, S_IRUGO | S_IWUSR,
			
 
				+		amdgpu_get_pp_sclk_od,
			
 
				+		amdgpu_set_pp_sclk_od);
			
 
				+static DEVICE_ATTR(pp_mclk_od, S_IRUGO | S_IWUSR,
			
 
				+		amdgpu_get_pp_mclk_od,
			
 
				+		amdgpu_set_pp_mclk_od);
			
 
				 
			
 
				 static ssize_t amdgpu_hwmon_show_temp(struct device *dev,
			
 
				 				      struct device_attribute *attr,
			
@@ -1108,22 +1224,34 @@ int amdgpu_pm_sysfs_init(struct amdgpu_device *adev)
 
				 			DRM_ERROR("failed to create device file pp_table\n");
			
 
				 			return ret;
			
 
				 		}
			
 
				-		ret = device_create_file(adev->dev, &dev_attr_pp_dpm_sclk);
			
 
				-		if (ret) {
			
 
				-			DRM_ERROR("failed to create device file pp_dpm_sclk\n");
			
 
				-			return ret;
			
 
				-		}
			
 
				-		ret = device_create_file(adev->dev, &dev_attr_pp_dpm_mclk);
			
 
				-		if (ret) {
			
 
				-			DRM_ERROR("failed to create device file pp_dpm_mclk\n");
			
 
				-			return ret;
			
 
				-		}
			
 
				-		ret = device_create_file(adev->dev, &dev_attr_pp_dpm_pcie);
			
 
				-		if (ret) {
			
 
				-			DRM_ERROR("failed to create device file pp_dpm_pcie\n");
			
 
				-			return ret;
			
 
				-		}
			
 
				 	}
			
 
				+
			
 
				+	ret = device_create_file(adev->dev, &dev_attr_pp_dpm_sclk);
			
 
				+	if (ret) {
			
 
				+		DRM_ERROR("failed to create device file pp_dpm_sclk\n");
			
 
				+		return ret;
			
 
				+	}
			
 
				+	ret = device_create_file(adev->dev, &dev_attr_pp_dpm_mclk);
			
 
				+	if (ret) {
			
 
				+		DRM_ERROR("failed to create device file pp_dpm_mclk\n");
			
 
				+		return ret;
			
 
				+	}
			
 
				+	ret = device_create_file(adev->dev, &dev_attr_pp_dpm_pcie);
			
 
				+	if (ret) {
			
 
				+		DRM_ERROR("failed to create device file pp_dpm_pcie\n");
			
 
				+		return ret;
			
 
				+	}
			
 
				+	ret = device_create_file(adev->dev, &dev_attr_pp_sclk_od);
			
 
				+	if (ret) {
			
 
				+		DRM_ERROR("failed to create device file pp_sclk_od\n");
			
 
				+		return ret;
			
 
				+	}
			
 
				+	ret = device_create_file(adev->dev, &dev_attr_pp_mclk_od);
			
 
				+	if (ret) {
			
 
				+		DRM_ERROR("failed to create device file pp_mclk_od\n");
			
 
				+		return ret;
			
 
				+	}
			
 
				+
			
 
				 	ret = amdgpu_debugfs_pm_init(adev);
			
 
				 	if (ret) {
			
 
				 		DRM_ERROR("Failed to register debugfs file for dpm!\n");
			
@@ -1146,10 +1274,12 @@ void amdgpu_pm_sysfs_fini(struct amdgpu_device *adev)
 
				 		device_remove_file(adev->dev, &dev_attr_pp_cur_state);
			
 
				 		device_remove_file(adev->dev, &dev_attr_pp_force_state);
			
 
				 		device_remove_file(adev->dev, &dev_attr_pp_table);
			
 
				-		device_remove_file(adev->dev, &dev_attr_pp_dpm_sclk);
			
 
				-		device_remove_file(adev->dev, &dev_attr_pp_dpm_mclk);
			
 
				-		device_remove_file(adev->dev, &dev_attr_pp_dpm_pcie);
			
 
				 	}
			
 
				+	device_remove_file(adev->dev, &dev_attr_pp_dpm_sclk);
			
 
				+	device_remove_file(adev->dev, &dev_attr_pp_dpm_mclk);
			
 
				+	device_remove_file(adev->dev, &dev_attr_pp_dpm_pcie);
			
 
				+	device_remove_file(adev->dev, &dev_attr_pp_sclk_od);
			
 
				+	device_remove_file(adev->dev, &dev_attr_pp_mclk_od);
			
 
				 }
			
 
				 
			
 
				 void amdgpu_pm_compute_clocks(struct amdgpu_device *adev)
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_powerplay.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_powerplay.c
@@ -52,6 +52,7 @@ static int amdgpu_powerplay_init(struct amdgpu_device *adev)
 
				 		pp_init->chip_family = adev->family;
			
 
				 		pp_init->chip_id = adev->asic_type;
			
 
				 		pp_init->device = amdgpu_cgs_create_device(adev);
			
 
				+		pp_init->powercontainment_enabled = amdgpu_powercontainment;
			
 
				 
			
 
				 		ret = amd_powerplay_init(pp_init, amd_pp);
			
 
				 		kfree(pp_init);
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.c
@@ -28,6 +28,7 @@
 
				  */
			
 
				 #include <linux/seq_file.h>
			
 
				 #include <linux/slab.h>
			
 
				+#include <linux/debugfs.h>
			
 
				 #include <drm/drmP.h>
			
 
				 #include <drm/amdgpu_drm.h>
			
 
				 #include "amdgpu.h"
			
@@ -48,6 +49,7 @@
 
				  */
			
 
				 static int amdgpu_debugfs_ring_init(struct amdgpu_device *adev,
			
 
				 				    struct amdgpu_ring *ring);
			
 
				+static void amdgpu_debugfs_ring_fini(struct amdgpu_ring *ring);
			
 
				 
			
 
				 /**
			
 
				  * amdgpu_ring_alloc - allocate space on the ring buffer
			
@@ -139,78 +141,6 @@ void amdgpu_ring_undo(struct amdgpu_ring *ring)
 
				 	ring->wptr = ring->wptr_old;
			
 
				 }
			
 
				 
			
 
				-/**
			
 
				- * amdgpu_ring_backup - Back up the content of a ring
			
 
				- *
			
 
				- * @ring: the ring we want to back up
			
 
				- *
			
 
				- * Saves all unprocessed commits from a ring, returns the number of dwords saved.
			
 
				- */
			
 
				-unsigned amdgpu_ring_backup(struct amdgpu_ring *ring,
			
 
				-			    uint32_t **data)
			
 
				-{
			
 
				-	unsigned size, ptr, i;
			
 
				-
			
 
				-	*data = NULL;
			
 
				-
			
 
				-	if (ring->ring_obj == NULL)
			
 
				-		return 0;
			
 
				-
			
 
				-	/* it doesn't make sense to save anything if all fences are signaled */
			
 
				-	if (!amdgpu_fence_count_emitted(ring))
			
 
				-		return 0;
			
 
				-
			
 
				-	ptr = le32_to_cpu(*ring->next_rptr_cpu_addr);
			
 
				-
			
 
				-	size = ring->wptr + (ring->ring_size / 4);
			
 
				-	size -= ptr;
			
 
				-	size &= ring->ptr_mask;
			
 
				-	if (size == 0)
			
 
				-		return 0;
			
 
				-
			
 
				-	/* and then save the content of the ring */
			
 
				-	*data = kmalloc_array(size, sizeof(uint32_t), GFP_KERNEL);
			
 
				-	if (!*data)
			
 
				-		return 0;
			
 
				-	for (i = 0; i < size; ++i) {
			
 
				-		(*data)[i] = ring->ring[ptr++];
			
 
				-		ptr &= ring->ptr_mask;
			
 
				-	}
			
 
				-
			
 
				-	return size;
			
 
				-}
			
 
				-
			
 
				-/**
			
 
				- * amdgpu_ring_restore - append saved commands to the ring again
			
 
				- *
			
 
				- * @ring: ring to append commands to
			
 
				- * @size: number of dwords we want to write
			
 
				- * @data: saved commands
			
 
				- *
			
 
				- * Allocates space on the ring and restore the previously saved commands.
			
 
				- */
			
 
				-int amdgpu_ring_restore(struct amdgpu_ring *ring,
			
 
				-			unsigned size, uint32_t *data)
			
 
				-{
			
 
				-	int i, r;
			
 
				-
			
 
				-	if (!size || !data)
			
 
				-		return 0;
			
 
				-
			
 
				-	/* restore the saved ring content */
			
 
				-	r = amdgpu_ring_alloc(ring, size);
			
 
				-	if (r)
			
 
				-		return r;
			
 
				-
			
 
				-	for (i = 0; i < size; ++i) {
			
 
				-		amdgpu_ring_write(ring, data[i]);
			
 
				-	}
			
 
				-
			
 
				-	amdgpu_ring_commit(ring);
			
 
				-	kfree(data);
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 /**
			
 
				  * amdgpu_ring_init - init driver ring struct.
			
 
				  *
			
@@ -260,14 +190,6 @@ int amdgpu_ring_init(struct amdgpu_device *adev, struct amdgpu_ring *ring,
 
				 		return r;
			
 
				 	}
			
 
				 
			
 
				-	r = amdgpu_wb_get(adev, &ring->next_rptr_offs);
			
 
				-	if (r) {
			
 
				-		dev_err(adev->dev, "(%d) ring next_rptr wb alloc failed\n", r);
			
 
				-		return r;
			
 
				-	}
			
 
				-	ring->next_rptr_gpu_addr = adev->wb.gpu_addr + ring->next_rptr_offs * 4;
			
 
				-	ring->next_rptr_cpu_addr = &adev->wb.wb[ring->next_rptr_offs];
			
 
				-
			
 
				 	r = amdgpu_wb_get(adev, &ring->cond_exe_offs);
			
 
				 	if (r) {
			
 
				 		dev_err(adev->dev, "(%d) ring cond_exec_polling wb alloc failed\n", r);
			
@@ -310,6 +232,9 @@ int amdgpu_ring_init(struct amdgpu_device *adev, struct amdgpu_ring *ring,
 
				 		}
			
 
				 		r = amdgpu_bo_kmap(ring->ring_obj,
			
 
				 				       (void **)&ring->ring);
			
 
				+
			
 
				+		memset((void *)ring->ring, 0, ring->ring_size);
			
 
				+
			
 
				 		amdgpu_bo_unreserve(ring->ring_obj);
			
 
				 		if (r) {
			
 
				 			dev_err(adev->dev, "(%d) ring map failed\n", r);
			
@@ -347,7 +272,6 @@ void amdgpu_ring_fini(struct amdgpu_ring *ring)
 
				 	amdgpu_wb_free(ring->adev, ring->fence_offs);
			
 
				 	amdgpu_wb_free(ring->adev, ring->rptr_offs);
			
 
				 	amdgpu_wb_free(ring->adev, ring->wptr_offs);
			
 
				-	amdgpu_wb_free(ring->adev, ring->next_rptr_offs);
			
 
				 
			
 
				 	if (ring_obj) {
			
 
				 		r = amdgpu_bo_reserve(ring_obj, false);
			
@@ -358,6 +282,7 @@ void amdgpu_ring_fini(struct amdgpu_ring *ring)
 
				 		}
			
 
				 		amdgpu_bo_unref(&ring_obj);
			
 
				 	}
			
 
				+	amdgpu_debugfs_ring_fini(ring);
			
 
				 }
			
 
				 
			
 
				 /*
			
@@ -365,57 +290,62 @@ void amdgpu_ring_fini(struct amdgpu_ring *ring)
 
				  */
			
 
				 #if defined(CONFIG_DEBUG_FS)
			
 
				 
			
 
				-static int amdgpu_debugfs_ring_info(struct seq_file *m, void *data)
			
 
				+/* Layout of file is 12 bytes consisting of
			
 
				+ * - rptr
			
 
				+ * - wptr
			
 
				+ * - driver's copy of wptr
			
 
				+ *
			
 
				+ * followed by n-words of ring data
			
 
				+ */
			
 
				+static ssize_t amdgpu_debugfs_ring_read(struct file *f, char __user *buf,
			
 
				+					size_t size, loff_t *pos)
			
 
				 {
			
 
				-	struct drm_info_node *node = (struct drm_info_node *) m->private;
			
 
				-	struct drm_device *dev = node->minor->dev;
			
 
				-	struct amdgpu_device *adev = dev->dev_private;
			
 
				-	int roffset = (unsigned long)node->info_ent->data;
			
 
				-	struct amdgpu_ring *ring = (void *)(((uint8_t*)adev) + roffset);
			
 
				-	uint32_t rptr, wptr, rptr_next;
			
 
				-	unsigned i;
			
 
				-
			
 
				-	wptr = amdgpu_ring_get_wptr(ring);
			
 
				-	seq_printf(m, "wptr: 0x%08x [%5d]\n", wptr, wptr);
			
 
				-
			
 
				-	rptr = amdgpu_ring_get_rptr(ring);
			
 
				-	rptr_next = le32_to_cpu(*ring->next_rptr_cpu_addr);
			
 
				-
			
 
				-	seq_printf(m, "rptr: 0x%08x [%5d]\n", rptr, rptr);
			
 
				-
			
 
				-	seq_printf(m, "driver's copy of the wptr: 0x%08x [%5d]\n",
			
 
				-		   ring->wptr, ring->wptr);
			
 
				-
			
 
				-	if (!ring->ready)
			
 
				-		return 0;
			
 
				-
			
 
				-	/* print 8 dw before current rptr as often it's the last executed
			
 
				-	 * packet that is the root issue
			
 
				-	 */
			
 
				-	i = (rptr + ring->ptr_mask + 1 - 32) & ring->ptr_mask;
			
 
				-	while (i != rptr) {
			
 
				-		seq_printf(m, "r[%5d]=0x%08x", i, ring->ring[i]);
			
 
				-		if (i == rptr)
			
 
				-			seq_puts(m, " *");
			
 
				-		if (i == rptr_next)
			
 
				-			seq_puts(m, " #");
			
 
				-		seq_puts(m, "\n");
			
 
				-		i = (i + 1) & ring->ptr_mask;
			
 
				+	struct amdgpu_ring *ring = (struct amdgpu_ring*)f->f_inode->i_private;
			
 
				+	int r, i;
			
 
				+	uint32_t value, result, early[3];
			
 
				+
			
 
				+	if (*pos & 3 || size & 3)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	result = 0;
			
 
				+
			
 
				+	if (*pos < 12) {
			
 
				+		early[0] = amdgpu_ring_get_rptr(ring);
			
 
				+		early[1] = amdgpu_ring_get_wptr(ring);
			
 
				+		early[2] = ring->wptr;
			
 
				+		for (i = *pos / 4; i < 3 && size; i++) {
			
 
				+			r = put_user(early[i], (uint32_t *)buf);
			
 
				+			if (r)
			
 
				+				return r;
			
 
				+			buf += 4;
			
 
				+			result += 4;
			
 
				+			size -= 4;
			
 
				+			*pos += 4;
			
 
				+		}
			
 
				 	}
			
 
				-	while (i != wptr) {
			
 
				-		seq_printf(m, "r[%5d]=0x%08x", i, ring->ring[i]);
			
 
				-		if (i == rptr)
			
 
				-			seq_puts(m, " *");
			
 
				-		if (i == rptr_next)
			
 
				-			seq_puts(m, " #");
			
 
				-		seq_puts(m, "\n");
			
 
				-		i = (i + 1) & ring->ptr_mask;
			
 
				+
			
 
				+	while (size) {
			
 
				+		if (*pos >= (ring->ring_size + 12))
			
 
				+			return result;
			
 
				+			
			
 
				+		value = ring->ring[(*pos - 12)/4];
			
 
				+		r = put_user(value, (uint32_t*)buf);
			
 
				+		if (r)
			
 
				+			return r;
			
 
				+		buf += 4;
			
 
				+		result += 4;
			
 
				+		size -= 4;
			
 
				+		*pos += 4;
			
 
				 	}
			
 
				-	return 0;
			
 
				+
			
 
				+	return result;
			
 
				 }
			
 
				 
			
 
				-static struct drm_info_list amdgpu_debugfs_ring_info_list[AMDGPU_MAX_RINGS];
			
 
				-static char amdgpu_debugfs_ring_names[AMDGPU_MAX_RINGS][32];
			
 
				+static const struct file_operations amdgpu_debugfs_ring_fops = {
			
 
				+	.owner = THIS_MODULE,
			
 
				+	.read = amdgpu_debugfs_ring_read,
			
 
				+	.llseek = default_llseek
			
 
				+};
			
 
				 
			
 
				 #endif
			
 
				 
			
@@ -423,28 +353,27 @@ static int amdgpu_debugfs_ring_init(struct amdgpu_device *adev,
 
				 				    struct amdgpu_ring *ring)
			
 
				 {
			
 
				 #if defined(CONFIG_DEBUG_FS)
			
 
				-	unsigned offset = (uint8_t*)ring - (uint8_t*)adev;
			
 
				-	unsigned i;
			
 
				-	struct drm_info_list *info;
			
 
				-	char *name;
			
 
				-
			
 
				-	for (i = 0; i < ARRAY_SIZE(amdgpu_debugfs_ring_info_list); ++i) {
			
 
				-		info = &amdgpu_debugfs_ring_info_list[i];
			
 
				-		if (!info->data)
			
 
				-			break;
			
 
				-	}
			
 
				+	struct drm_minor *minor = adev->ddev->primary;
			
 
				+	struct dentry *ent, *root = minor->debugfs_root;
			
 
				+	char name[32];
			
 
				 
			
 
				-	if (i == ARRAY_SIZE(amdgpu_debugfs_ring_info_list))
			
 
				-		return -ENOSPC;
			
 
				-
			
 
				-	name = &amdgpu_debugfs_ring_names[i][0];
			
 
				 	sprintf(name, "amdgpu_ring_%s", ring->name);
			
 
				-	info->name = name;
			
 
				-	info->show = amdgpu_debugfs_ring_info;
			
 
				-	info->driver_features = 0;
			
 
				-	info->data = (void*)(uintptr_t)offset;
			
 
				 
			
 
				-	return amdgpu_debugfs_add_files(adev, info, 1);
			
 
				+	ent = debugfs_create_file(name,
			
 
				+				  S_IFREG | S_IRUGO, root,
			
 
				+				  ring, &amdgpu_debugfs_ring_fops);
			
 
				+	if (IS_ERR(ent))
			
 
				+		return PTR_ERR(ent);
			
 
				+
			
 
				+	i_size_write(ent->d_inode, ring->ring_size + 12);
			
 
				+	ring->ent = ent;
			
 
				 #endif
			
 
				 	return 0;
			
 
				 }
			
 
				+
			
 
				+static void amdgpu_debugfs_ring_fini(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+#if defined(CONFIG_DEBUG_FS)
			
 
				+	debugfs_remove(ring->ent);
			
 
				+#endif
			
 
				+}
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_sync.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_sync.c
@@ -223,13 +223,16 @@ int amdgpu_sync_resv(struct amdgpu_device *adev,
 
				 }
			
 
				 
			
 
				 /**
			
 
				- * amdgpu_sync_is_idle - test if all fences are signaled
			
 
				+ * amdgpu_sync_peek_fence - get the next fence not signaled yet
			
 
				  *
			
 
				  * @sync: the sync object
			
 
				+ * @ring: optional ring to use for test
			
 
				  *
			
 
				- * Returns true if all fences in the sync object are signaled.
			
 
				+ * Returns the next fence not signaled yet without removing it from the sync
			
 
				+ * object.
			
 
				  */
			
 
				-bool amdgpu_sync_is_idle(struct amdgpu_sync *sync)
			
 
				+struct fence *amdgpu_sync_peek_fence(struct amdgpu_sync *sync,
			
 
				+				     struct amdgpu_ring *ring)
			
 
				 {
			
 
				 	struct amdgpu_sync_entry *e;
			
 
				 	struct hlist_node *tmp;
			
@@ -237,6 +240,19 @@ bool amdgpu_sync_is_idle(struct amdgpu_sync *sync)
 
				 
			
 
				 	hash_for_each_safe(sync->fences, i, tmp, e, node) {
			
 
				 		struct fence *f = e->fence;
			
 
				+		struct amd_sched_fence *s_fence = to_amd_sched_fence(f);
			
 
				+
			
 
				+		if (ring && s_fence) {
			
 
				+			/* For fences from the same ring it is sufficient
			
 
				+			 * when they are scheduled.
			
 
				+			 */
			
 
				+			if (s_fence->sched == &ring->sched) {
			
 
				+				if (fence_is_signaled(&s_fence->scheduled))
			
 
				+					continue;
			
 
				+
			
 
				+				return &s_fence->scheduled;
			
 
				+			}
			
 
				+		}
			
 
				 
			
 
				 		if (fence_is_signaled(f)) {
			
 
				 			hash_del(&e->node);
			
@@ -245,58 +261,19 @@ bool amdgpu_sync_is_idle(struct amdgpu_sync *sync)
 
				 			continue;
			
 
				 		}
			
 
				 
			
 
				-		return false;
			
 
				+		return f;
			
 
				 	}
			
 
				 
			
 
				-	return true;
			
 
				+	return NULL;
			
 
				 }
			
 
				 
			
 
				 /**
			
 
				- * amdgpu_sync_cycle_fences - move fences from one sync object into another
			
 
				+ * amdgpu_sync_get_fence - get the next fence from the sync object
			
 
				  *
			
 
				- * @dst: the destination sync object
			
 
				- * @src: the source sync object
			
 
				- * @fence: fence to add to source
			
 
				+ * @sync: sync object to use
			
 
				  *
			
 
				- * Remove all fences from source and put them into destination and add
			
 
				- * fence as new one into source.
			
 
				+ * Get and removes the next fence from the sync object not signaled yet.
			
 
				  */
			
 
				-int amdgpu_sync_cycle_fences(struct amdgpu_sync *dst, struct amdgpu_sync *src,
			
 
				-			     struct fence *fence)
			
 
				-{
			
 
				-	struct amdgpu_sync_entry *e, *newone;
			
 
				-	struct hlist_node *tmp;
			
 
				-	int i;
			
 
				-
			
 
				-	/* Allocate the new entry before moving the old ones */
			
 
				-	newone = kmem_cache_alloc(amdgpu_sync_slab, GFP_KERNEL);
			
 
				-	if (!newone)
			
 
				-		return -ENOMEM;
			
 
				-
			
 
				-	hash_for_each_safe(src->fences, i, tmp, e, node) {
			
 
				-		struct fence *f = e->fence;
			
 
				-
			
 
				-		hash_del(&e->node);
			
 
				-		if (fence_is_signaled(f)) {
			
 
				-			fence_put(f);
			
 
				-			kmem_cache_free(amdgpu_sync_slab, e);
			
 
				-			continue;
			
 
				-		}
			
 
				-
			
 
				-		if (amdgpu_sync_add_later(dst, f)) {
			
 
				-			kmem_cache_free(amdgpu_sync_slab, e);
			
 
				-			continue;
			
 
				-		}
			
 
				-
			
 
				-		hash_add(dst->fences, &e->node, f->context);
			
 
				-	}
			
 
				-
			
 
				-	hash_add(src->fences, &newone->node, fence->context);
			
 
				-	newone->fence = fence_get(fence);
			
 
				-
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 struct fence *amdgpu_sync_get_fence(struct amdgpu_sync *sync)
			
 
				 {
			
 
				 	struct amdgpu_sync_entry *e;
			
@@ -319,25 +296,6 @@ struct fence *amdgpu_sync_get_fence(struct amdgpu_sync *sync)
 
				 	return NULL;
			
 
				 }
			
 
				 
			
 
				-int amdgpu_sync_wait(struct amdgpu_sync *sync)
			
 
				-{
			
 
				-	struct amdgpu_sync_entry *e;
			
 
				-	struct hlist_node *tmp;
			
 
				-	int i, r;
			
 
				-
			
 
				-	hash_for_each_safe(sync->fences, i, tmp, e, node) {
			
 
				-		r = fence_wait(e->fence, false);
			
 
				-		if (r)
			
 
				-			return r;
			
 
				-
			
 
				-		hash_del(&e->node);
			
 
				-		fence_put(e->fence);
			
 
				-		kmem_cache_free(amdgpu_sync_slab, e);
			
 
				-	}
			
 
				-
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 /**
			
 
				  * amdgpu_sync_free - free the sync object
			
 
				  *
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_trace.h
@@ -11,19 +11,68 @@
 
				 #define TRACE_SYSTEM amdgpu
			
 
				 #define TRACE_INCLUDE_FILE amdgpu_trace
			
 
				 
			
 
				+TRACE_EVENT(amdgpu_mm_rreg,
			
 
				+	    TP_PROTO(unsigned did, uint32_t reg, uint32_t value),
			
 
				+	    TP_ARGS(did, reg, value),
			
 
				+	    TP_STRUCT__entry(
			
 
				+				__field(unsigned, did)
			
 
				+				__field(uint32_t, reg)
			
 
				+				__field(uint32_t, value)
			
 
				+			    ),
			
 
				+	    TP_fast_assign(
			
 
				+			   __entry->did = did;
			
 
				+			   __entry->reg = reg;
			
 
				+			   __entry->value = value;
			
 
				+			   ),
			
 
				+	    TP_printk("0x%04lx, 0x%04lx, 0x%08lx",
			
 
				+		      (unsigned long)__entry->did,
			
 
				+		      (unsigned long)__entry->reg,
			
 
				+		      (unsigned long)__entry->value)
			
 
				+);
			
 
				+
			
 
				+TRACE_EVENT(amdgpu_mm_wreg,
			
 
				+	    TP_PROTO(unsigned did, uint32_t reg, uint32_t value),
			
 
				+	    TP_ARGS(did, reg, value),
			
 
				+	    TP_STRUCT__entry(
			
 
				+				__field(unsigned, did)
			
 
				+				__field(uint32_t, reg)
			
 
				+				__field(uint32_t, value)
			
 
				+			    ),
			
 
				+	    TP_fast_assign(
			
 
				+			   __entry->did = did;
			
 
				+			   __entry->reg = reg;
			
 
				+			   __entry->value = value;
			
 
				+			   ),
			
 
				+	    TP_printk("0x%04lx, 0x%04lx, 0x%08lx",
			
 
				+		      (unsigned long)__entry->did,
			
 
				+		      (unsigned long)__entry->reg,
			
 
				+		      (unsigned long)__entry->value)
			
 
				+);
			
 
				+
			
 
				 TRACE_EVENT(amdgpu_bo_create,
			
 
				 	    TP_PROTO(struct amdgpu_bo *bo),
			
 
				 	    TP_ARGS(bo),
			
 
				 	    TP_STRUCT__entry(
			
 
				 			     __field(struct amdgpu_bo *, bo)
			
 
				 			     __field(u32, pages)
			
 
				+			     __field(u32, type)
			
 
				+			     __field(u32, prefer)
			
 
				+			     __field(u32, allow)
			
 
				+			     __field(u32, visible)
			
 
				 			     ),
			
 
				 
			
 
				 	    TP_fast_assign(
			
 
				 			   __entry->bo = bo;
			
 
				 			   __entry->pages = bo->tbo.num_pages;
			
 
				+			   __entry->type = bo->tbo.mem.mem_type;
			
 
				+			   __entry->prefer = bo->prefered_domains;
			
 
				+			   __entry->allow = bo->allowed_domains;
			
 
				+			   __entry->visible = bo->flags;
			
 
				 			   ),
			
 
				-	    TP_printk("bo=%p, pages=%u", __entry->bo, __entry->pages)
			
 
				+
			
 
				+	    TP_printk("bo=%p,pages=%u,type=%d,prefered=%d,allowed=%d,visible=%d",
			
 
				+		       __entry->bo, __entry->pages, __entry->type,
			
 
				+		       __entry->prefer, __entry->allow, __entry->visible)
			
 
				 );
			
 
				 
			
 
				 TRACE_EVENT(amdgpu_cs,
			
@@ -64,7 +113,7 @@ TRACE_EVENT(amdgpu_cs_ioctl,
 
				 			   __entry->adev = job->adev;
			
 
				 			   __entry->sched_job = &job->base;
			
 
				 			   __entry->ib = job->ibs;
			
 
				-			   __entry->fence = &job->base.s_fence->base;
			
 
				+			   __entry->fence = &job->base.s_fence->finished;
			
 
				 			   __entry->ring_name = job->ring->name;
			
 
				 			   __entry->num_ibs = job->num_ibs;
			
 
				 			   ),
			
@@ -89,7 +138,7 @@ TRACE_EVENT(amdgpu_sched_run_job,
 
				 			   __entry->adev = job->adev;
			
 
				 			   __entry->sched_job = &job->base;
			
 
				 			   __entry->ib = job->ibs;
			
 
				-			   __entry->fence = &job->base.s_fence->base;
			
 
				+			   __entry->fence = &job->base.s_fence->finished;
			
 
				 			   __entry->ring_name = job->ring->name;
			
 
				 			   __entry->num_ibs = job->num_ibs;
			
 
				 			   ),
			
@@ -244,13 +293,55 @@ TRACE_EVENT(amdgpu_bo_list_set,
 
				 	    TP_STRUCT__entry(
			
 
				 			     __field(struct amdgpu_bo_list *, list)
			
 
				 			     __field(struct amdgpu_bo *, bo)
			
 
				+			     __field(u64, bo_size)
			
 
				 			     ),
			
 
				 
			
 
				 	    TP_fast_assign(
			
 
				 			   __entry->list = list;
			
 
				 			   __entry->bo = bo;
			
 
				+			   __entry->bo_size = amdgpu_bo_size(bo);
			
 
				 			   ),
			
 
				-	    TP_printk("list=%p, bo=%p", __entry->list, __entry->bo)
			
 
				+	    TP_printk("list=%p, bo=%p, bo_size = %Ld",
			
 
				+		      __entry->list,
			
 
				+		      __entry->bo,
			
 
				+		      __entry->bo_size)
			
 
				+);
			
 
				+
			
 
				+TRACE_EVENT(amdgpu_cs_bo_status,
			
 
				+	    TP_PROTO(uint64_t total_bo, uint64_t total_size),
			
 
				+	    TP_ARGS(total_bo, total_size),
			
 
				+	    TP_STRUCT__entry(
			
 
				+			__field(u64, total_bo)
			
 
				+			__field(u64, total_size)
			
 
				+			),
			
 
				+
			
 
				+	    TP_fast_assign(
			
 
				+			__entry->total_bo = total_bo;
			
 
				+			__entry->total_size = total_size;
			
 
				+			),
			
 
				+	    TP_printk("total bo size = %Ld, total bo count = %Ld",
			
 
				+			__entry->total_bo, __entry->total_size)
			
 
				+);
			
 
				+
			
 
				+TRACE_EVENT(amdgpu_ttm_bo_move,
			
 
				+	    TP_PROTO(struct amdgpu_bo* bo, uint32_t new_placement, uint32_t old_placement),
			
 
				+	    TP_ARGS(bo, new_placement, old_placement),
			
 
				+	    TP_STRUCT__entry(
			
 
				+			__field(struct amdgpu_bo *, bo)
			
 
				+			__field(u64, bo_size)
			
 
				+			__field(u32, new_placement)
			
 
				+			__field(u32, old_placement)
			
 
				+			),
			
 
				+
			
 
				+	    TP_fast_assign(
			
 
				+			__entry->bo      = bo;
			
 
				+			__entry->bo_size = amdgpu_bo_size(bo);
			
 
				+			__entry->new_placement = new_placement;
			
 
				+			__entry->old_placement = old_placement;
			
 
				+			),
			
 
				+	    TP_printk("bo=%p from:%d to %d with size = %Ld",
			
 
				+			__entry->bo, __entry->old_placement,
			
 
				+			__entry->new_placement, __entry->bo_size)
			
 
				 );
			
 
				 
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ttm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ttm.c
@@ -286,9 +286,10 @@ static int amdgpu_move_blit(struct ttm_buffer_object *bo,
 
				 	r = amdgpu_copy_buffer(ring, old_start, new_start,
			
 
				 			       new_mem->num_pages * PAGE_SIZE, /* bytes */
			
 
				 			       bo->resv, &fence);
			
 
				-	/* FIXME: handle copy error */
			
 
				-	r = ttm_bo_move_accel_cleanup(bo, fence,
			
 
				-				      evict, no_wait_gpu, new_mem);
			
 
				+	if (r)
			
 
				+		return r;
			
 
				+
			
 
				+	r = ttm_bo_pipeline_move(bo, fence, evict, new_mem);
			
 
				 	fence_put(fence);
			
 
				 	return r;
			
 
				 }
			
@@ -396,6 +397,11 @@ static int amdgpu_bo_move(struct ttm_buffer_object *bo,
 
				 		return -EINVAL;
			
 
				 
			
 
				 	adev = amdgpu_get_adev(bo->bdev);
			
 
				+
			
 
				+	/* remember the eviction */
			
 
				+	if (evict)
			
 
				+		atomic64_inc(&adev->num_evictions);
			
 
				+
			
 
				 	if (old_mem->mem_type == TTM_PL_SYSTEM && bo->ttm == NULL) {
			
 
				 		amdgpu_move_null(bo, new_mem);
			
 
				 		return 0;
			
@@ -429,7 +435,8 @@ static int amdgpu_bo_move(struct ttm_buffer_object *bo,
 
				 
			
 
				 	if (r) {
			
 
				 memcpy:
			
 
				-		r = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				+		r = ttm_bo_move_memcpy(bo, evict, interruptible,
			
 
				+				       no_wait_gpu, new_mem);
			
 
				 		if (r) {
			
 
				 			return r;
			
 
				 		}
			
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
@@ -25,6 +25,7 @@
 
				  *          Alex Deucher
			
 
				  *          Jerome Glisse
			
 
				  */
			
 
				+#include <linux/fence-array.h>
			
 
				 #include <drm/drmP.h>
			
 
				 #include <drm/amdgpu_drm.h>
			
 
				 #include "amdgpu.h"
			
@@ -114,16 +115,26 @@ void amdgpu_vm_get_pd_bo(struct amdgpu_vm *vm,
 
				 /**
			
 
				  * amdgpu_vm_get_bos - add the vm BOs to a duplicates list
			
 
				  *
			
 
				+ * @adev: amdgpu device pointer
			
 
				  * @vm: vm providing the BOs
			
 
				  * @duplicates: head of duplicates list
			
 
				  *
			
 
				  * Add the page directory to the BO duplicates list
			
 
				  * for command submission.
			
 
				  */
			
 
				-void amdgpu_vm_get_pt_bos(struct amdgpu_vm *vm, struct list_head *duplicates)
			
 
				+void amdgpu_vm_get_pt_bos(struct amdgpu_device *adev, struct amdgpu_vm *vm,
			
 
				+			  struct list_head *duplicates)
			
 
				 {
			
 
				+	uint64_t num_evictions;
			
 
				 	unsigned i;
			
 
				 
			
 
				+	/* We only need to validate the page tables
			
 
				+	 * if they aren't already valid.
			
 
				+	 */
			
 
				+	num_evictions = atomic64_read(&adev->num_evictions);
			
 
				+	if (num_evictions == vm->last_eviction_counter)
			
 
				+		return;
			
 
				+
			
 
				 	/* add the vm page table to the list */
			
 
				 	for (i = 0; i <= vm->max_pde_used; ++i) {
			
 
				 		struct amdgpu_bo_list_entry *entry = &vm->page_tables[i].entry;
			
@@ -162,6 +173,13 @@ void amdgpu_vm_move_pt_bos_in_lru(struct amdgpu_device *adev,
 
				 	spin_unlock(&glob->lru_lock);
			
 
				 }
			
 
				 
			
 
				+static bool amdgpu_vm_is_gpu_reset(struct amdgpu_device *adev,
			
 
				+			      struct amdgpu_vm_id *id)
			
 
				+{
			
 
				+	return id->current_gpu_reset_count !=
			
 
				+		atomic_read(&adev->gpu_reset_counter) ? true : false;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * amdgpu_vm_grab_id - allocate the next free VMID
			
 
				  *
			
@@ -174,20 +192,69 @@ void amdgpu_vm_move_pt_bos_in_lru(struct amdgpu_device *adev,
 
				  */
			
 
				 int amdgpu_vm_grab_id(struct amdgpu_vm *vm, struct amdgpu_ring *ring,
			
 
				 		      struct amdgpu_sync *sync, struct fence *fence,
			
 
				-		      unsigned *vm_id, uint64_t *vm_pd_addr)
			
 
				+		      struct amdgpu_job *job)
			
 
				 {
			
 
				-	uint64_t pd_addr = amdgpu_bo_gpu_offset(vm->page_directory);
			
 
				 	struct amdgpu_device *adev = ring->adev;
			
 
				 	struct fence *updates = sync->last_vm_update;
			
 
				-	struct amdgpu_vm_id *id;
			
 
				-	unsigned i = ring->idx;
			
 
				-	int r;
			
 
				+	struct amdgpu_vm_id *id, *idle;
			
 
				+	struct fence **fences;
			
 
				+	unsigned i;
			
 
				+	int r = 0;
			
 
				+
			
 
				+	fences = kmalloc_array(sizeof(void *), adev->vm_manager.num_ids,
			
 
				+			       GFP_KERNEL);
			
 
				+	if (!fences)
			
 
				+		return -ENOMEM;
			
 
				 
			
 
				 	mutex_lock(&adev->vm_manager.lock);
			
 
				 
			
 
				+	/* Check if we have an idle VMID */
			
 
				+	i = 0;
			
 
				+	list_for_each_entry(idle, &adev->vm_manager.ids_lru, list) {
			
 
				+		fences[i] = amdgpu_sync_peek_fence(&idle->active, ring);
			
 
				+		if (!fences[i])
			
 
				+			break;
			
 
				+		++i;
			
 
				+	}
			
 
				+
			
 
				+	/* If we can't find a idle VMID to use, wait till one becomes available */
			
 
				+	if (&idle->list == &adev->vm_manager.ids_lru) {
			
 
				+		u64 fence_context = adev->vm_manager.fence_context + ring->idx;
			
 
				+		unsigned seqno = ++adev->vm_manager.seqno[ring->idx];
			
 
				+		struct fence_array *array;
			
 
				+		unsigned j;
			
 
				+
			
 
				+		for (j = 0; j < i; ++j)
			
 
				+			fence_get(fences[j]);
			
 
				+
			
 
				+		array = fence_array_create(i, fences, fence_context,
			
 
				+					   seqno, true);
			
 
				+		if (!array) {
			
 
				+			for (j = 0; j < i; ++j)
			
 
				+				fence_put(fences[j]);
			
 
				+			kfree(fences);
			
 
				+			r = -ENOMEM;
			
 
				+			goto error;
			
 
				+		}
			
 
				+
			
 
				+
			
 
				+		r = amdgpu_sync_fence(ring->adev, sync, &array->base);
			
 
				+		fence_put(&array->base);
			
 
				+		if (r)
			
 
				+			goto error;
			
 
				+
			
 
				+		mutex_unlock(&adev->vm_manager.lock);
			
 
				+		return 0;
			
 
				+
			
 
				+	}
			
 
				+	kfree(fences);
			
 
				+
			
 
				+	job->vm_needs_flush = true;
			
 
				 	/* Check if we can use a VMID already assigned to this VM */
			
 
				+	i = ring->idx;
			
 
				 	do {
			
 
				 		struct fence *flushed;
			
 
				+		bool same_ring = ring->idx == i;
			
 
				 
			
 
				 		id = vm->ids[i++];
			
 
				 		if (i == AMDGPU_MAX_RINGS)
			
@@ -196,67 +263,49 @@ int amdgpu_vm_grab_id(struct amdgpu_vm *vm, struct amdgpu_ring *ring,
 
				 		/* Check all the prerequisites to using this VMID */
			
 
				 		if (!id)
			
 
				 			continue;
			
 
				+		if (amdgpu_vm_is_gpu_reset(adev, id))
			
 
				+			continue;
			
 
				 
			
 
				 		if (atomic64_read(&id->owner) != vm->client_id)
			
 
				 			continue;
			
 
				 
			
 
				-		if (pd_addr != id->pd_gpu_addr)
			
 
				+		if (job->vm_pd_addr != id->pd_gpu_addr)
			
 
				 			continue;
			
 
				 
			
 
				-		if (id->last_user != ring &&
			
 
				+		if (!same_ring &&
			
 
				 		    (!id->last_flush || !fence_is_signaled(id->last_flush)))
			
 
				 			continue;
			
 
				 
			
 
				 		flushed  = id->flushed_updates;
			
 
				-		if (updates && (!flushed || fence_is_later(updates, flushed)))
			
 
				+		if (updates &&
			
 
				+		    (!flushed || fence_is_later(updates, flushed)))
			
 
				 			continue;
			
 
				 
			
 
				-		/* Good we can use this VMID */
			
 
				-		if (id->last_user == ring) {
			
 
				-			r = amdgpu_sync_fence(ring->adev, sync,
			
 
				-					      id->first);
			
 
				-			if (r)
			
 
				-				goto error;
			
 
				-		}
			
 
				-
			
 
				-		/* And remember this submission as user of the VMID */
			
 
				+		/* Good we can use this VMID. Remember this submission as
			
 
				+		 * user of the VMID.
			
 
				+		 */
			
 
				 		r = amdgpu_sync_fence(ring->adev, &id->active, fence);
			
 
				 		if (r)
			
 
				 			goto error;
			
 
				 
			
 
				+		id->current_gpu_reset_count = atomic_read(&adev->gpu_reset_counter);
			
 
				 		list_move_tail(&id->list, &adev->vm_manager.ids_lru);
			
 
				 		vm->ids[ring->idx] = id;
			
 
				 
			
 
				-		*vm_id = id - adev->vm_manager.ids;
			
 
				-		*vm_pd_addr = AMDGPU_VM_NO_FLUSH;
			
 
				-		trace_amdgpu_vm_grab_id(vm, ring->idx, *vm_id, *vm_pd_addr);
			
 
				+		job->vm_id = id - adev->vm_manager.ids;
			
 
				+		job->vm_needs_flush = false;
			
 
				+		trace_amdgpu_vm_grab_id(vm, ring->idx, job->vm_id, job->vm_pd_addr);
			
 
				 
			
 
				 		mutex_unlock(&adev->vm_manager.lock);
			
 
				 		return 0;
			
 
				 
			
 
				 	} while (i != ring->idx);
			
 
				 
			
 
				-	id = list_first_entry(&adev->vm_manager.ids_lru,
			
 
				-			      struct amdgpu_vm_id,
			
 
				-			      list);
			
 
				+	/* Still no ID to use? Then use the idle one found earlier */
			
 
				+	id = idle;
			
 
				 
			
 
				-	if (!amdgpu_sync_is_idle(&id->active)) {
			
 
				-		struct list_head *head = &adev->vm_manager.ids_lru;
			
 
				-		struct amdgpu_vm_id *tmp;
			
 
				-
			
 
				-		list_for_each_entry_safe(id, tmp, &adev->vm_manager.ids_lru,
			
 
				-					 list) {
			
 
				-			if (amdgpu_sync_is_idle(&id->active)) {
			
 
				-				list_move(&id->list, head);
			
 
				-				head = &id->list;
			
 
				-			}
			
 
				-		}
			
 
				-		id = list_first_entry(&adev->vm_manager.ids_lru,
			
 
				-				      struct amdgpu_vm_id,
			
 
				-				      list);
			
 
				-	}
			
 
				-
			
 
				-	r = amdgpu_sync_cycle_fences(sync, &id->active, fence);
			
 
				+	/* Remember this submission as user of the VMID */
			
 
				+	r = amdgpu_sync_fence(ring->adev, &id->active, fence);
			
 
				 	if (r)
			
 
				 		goto error;
			
 
				 
			
@@ -269,22 +318,46 @@ int amdgpu_vm_grab_id(struct amdgpu_vm *vm, struct amdgpu_ring *ring,
 
				 	fence_put(id->flushed_updates);
			
 
				 	id->flushed_updates = fence_get(updates);
			
 
				 
			
 
				-	id->pd_gpu_addr = pd_addr;
			
 
				-
			
 
				+	id->pd_gpu_addr = job->vm_pd_addr;
			
 
				+	id->current_gpu_reset_count = atomic_read(&adev->gpu_reset_counter);
			
 
				 	list_move_tail(&id->list, &adev->vm_manager.ids_lru);
			
 
				-	id->last_user = ring;
			
 
				 	atomic64_set(&id->owner, vm->client_id);
			
 
				 	vm->ids[ring->idx] = id;
			
 
				 
			
 
				-	*vm_id = id - adev->vm_manager.ids;
			
 
				-	*vm_pd_addr = pd_addr;
			
 
				-	trace_amdgpu_vm_grab_id(vm, ring->idx, *vm_id, *vm_pd_addr);
			
 
				+	job->vm_id = id - adev->vm_manager.ids;
			
 
				+	trace_amdgpu_vm_grab_id(vm, ring->idx, job->vm_id, job->vm_pd_addr);
			
 
				 
			
 
				 error:
			
 
				 	mutex_unlock(&adev->vm_manager.lock);
			
 
				 	return r;
			
 
				 }
			
 
				 
			
 
				+static bool amdgpu_vm_ring_has_compute_vm_bug(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	struct amdgpu_device *adev = ring->adev;
			
 
				+	const struct amdgpu_ip_block_version *ip_block;
			
 
				+
			
 
				+	if (ring->type != AMDGPU_RING_TYPE_COMPUTE)
			
 
				+		/* only compute rings */
			
 
				+		return false;
			
 
				+
			
 
				+	ip_block = amdgpu_get_ip_block(adev, AMD_IP_BLOCK_TYPE_GFX);
			
 
				+	if (!ip_block)
			
 
				+		return false;
			
 
				+
			
 
				+	if (ip_block->major <= 7) {
			
 
				+		/* gfx7 has no workaround */
			
 
				+		return true;
			
 
				+	} else if (ip_block->major == 8) {
			
 
				+		if (adev->gfx.mec_fw_version >= 673)
			
 
				+			/* gfx8 is fixed in MEC firmware 673 */
			
 
				+			return false;
			
 
				+		else
			
 
				+			return true;
			
 
				+	}
			
 
				+	return false;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * amdgpu_vm_flush - hardware flush the vm
			
 
				  *
			
@@ -294,59 +367,52 @@ error:
 
				  *
			
 
				  * Emit a VM flush when it is necessary.
			
 
				  */
			
 
				-int amdgpu_vm_flush(struct amdgpu_ring *ring,
			
 
				-		    unsigned vm_id, uint64_t pd_addr,
			
 
				-		    uint32_t gds_base, uint32_t gds_size,
			
 
				-		    uint32_t gws_base, uint32_t gws_size,
			
 
				-		    uint32_t oa_base, uint32_t oa_size)
			
 
				+int amdgpu_vm_flush(struct amdgpu_ring *ring, struct amdgpu_job *job)
			
 
				 {
			
 
				 	struct amdgpu_device *adev = ring->adev;
			
 
				-	struct amdgpu_vm_id *id = &adev->vm_manager.ids[vm_id];
			
 
				+	struct amdgpu_vm_id *id = &adev->vm_manager.ids[job->vm_id];
			
 
				 	bool gds_switch_needed = ring->funcs->emit_gds_switch && (
			
 
				-		id->gds_base != gds_base ||
			
 
				-		id->gds_size != gds_size ||
			
 
				-		id->gws_base != gws_base ||
			
 
				-		id->gws_size != gws_size ||
			
 
				-		id->oa_base != oa_base ||
			
 
				-		id->oa_size != oa_size);
			
 
				+		id->gds_base != job->gds_base ||
			
 
				+		id->gds_size != job->gds_size ||
			
 
				+		id->gws_base != job->gws_base ||
			
 
				+		id->gws_size != job->gws_size ||
			
 
				+		id->oa_base != job->oa_base ||
			
 
				+		id->oa_size != job->oa_size);
			
 
				 	int r;
			
 
				 
			
 
				 	if (ring->funcs->emit_pipeline_sync && (
			
 
				-	    pd_addr != AMDGPU_VM_NO_FLUSH || gds_switch_needed ||
			
 
				-		    ring->type == AMDGPU_RING_TYPE_COMPUTE))
			
 
				+	    job->vm_needs_flush || gds_switch_needed ||
			
 
				+	    amdgpu_vm_ring_has_compute_vm_bug(ring)))
			
 
				 		amdgpu_ring_emit_pipeline_sync(ring);
			
 
				 
			
 
				-	if (ring->funcs->emit_vm_flush &&
			
 
				-	    pd_addr != AMDGPU_VM_NO_FLUSH) {
			
 
				+	if (ring->funcs->emit_vm_flush && (job->vm_needs_flush ||
			
 
				+	    amdgpu_vm_is_gpu_reset(adev, id))) {
			
 
				 		struct fence *fence;
			
 
				 
			
 
				-		trace_amdgpu_vm_flush(pd_addr, ring->idx, vm_id);
			
 
				-		amdgpu_ring_emit_vm_flush(ring, vm_id, pd_addr);
			
 
				+		trace_amdgpu_vm_flush(job->vm_pd_addr, ring->idx, job->vm_id);
			
 
				+		amdgpu_ring_emit_vm_flush(ring, job->vm_id, job->vm_pd_addr);
			
 
				+
			
 
				+		r = amdgpu_fence_emit(ring, &fence);
			
 
				+		if (r)
			
 
				+			return r;
			
 
				 
			
 
				 		mutex_lock(&adev->vm_manager.lock);
			
 
				-		if ((id->pd_gpu_addr == pd_addr) && (id->last_user == ring)) {
			
 
				-			r = amdgpu_fence_emit(ring, &fence);
			
 
				-			if (r) {
			
 
				-				mutex_unlock(&adev->vm_manager.lock);
			
 
				-				return r;
			
 
				-			}
			
 
				-			fence_put(id->last_flush);
			
 
				-			id->last_flush = fence;
			
 
				-		}
			
 
				+		fence_put(id->last_flush);
			
 
				+		id->last_flush = fence;
			
 
				 		mutex_unlock(&adev->vm_manager.lock);
			
 
				 	}
			
 
				 
			
 
				 	if (gds_switch_needed) {
			
 
				-		id->gds_base = gds_base;
			
 
				-		id->gds_size = gds_size;
			
 
				-		id->gws_base = gws_base;
			
 
				-		id->gws_size = gws_size;
			
 
				-		id->oa_base = oa_base;
			
 
				-		id->oa_size = oa_size;
			
 
				-		amdgpu_ring_emit_gds_switch(ring, vm_id,
			
 
				-					    gds_base, gds_size,
			
 
				-					    gws_base, gws_size,
			
 
				-					    oa_base, oa_size);
			
 
				+		id->gds_base = job->gds_base;
			
 
				+		id->gds_size = job->gds_size;
			
 
				+		id->gws_base = job->gws_base;
			
 
				+		id->gws_size = job->gws_size;
			
 
				+		id->oa_base = job->oa_base;
			
 
				+		id->oa_size = job->oa_size;
			
 
				+		amdgpu_ring_emit_gds_switch(ring, job->vm_id,
			
 
				+					    job->gds_base, job->gds_size,
			
 
				+					    job->gws_base, job->gws_size,
			
 
				+					    job->oa_base, job->oa_size);
			
 
				 	}
			
 
				 
			
 
				 	return 0;
			
@@ -723,7 +789,7 @@ static void amdgpu_vm_frag_ptes(struct amdgpu_device *adev,
 
				  * @vm: requested vm
			
 
				  * @start: start of GPU address range
			
 
				  * @end: end of GPU address range
			
 
				- * @dst: destination address to map to
			
 
				+ * @dst: destination address to map to, the next dst inside the function
			
 
				  * @flags: mapping flags
			
 
				  *
			
 
				  * Update the page tables in the range @start - @end.
			
@@ -737,49 +803,75 @@ static void amdgpu_vm_update_ptes(struct amdgpu_device *adev,
 
				 {
			
 
				 	const uint64_t mask = AMDGPU_VM_PTE_COUNT - 1;
			
 
				 
			
 
				-	uint64_t last_pe_start = ~0, last_pe_end = ~0, last_dst = ~0;
			
 
				-	uint64_t addr;
			
 
				+	uint64_t cur_pe_start, cur_pe_end, cur_dst;
			
 
				+	uint64_t addr; /* next GPU address to be updated */
			
 
				+	uint64_t pt_idx;
			
 
				+	struct amdgpu_bo *pt;
			
 
				+	unsigned nptes; /* next number of ptes to be updated */
			
 
				+	uint64_t next_pe_start;
			
 
				+
			
 
				+	/* initialize the variables */
			
 
				+	addr = start;
			
 
				+	pt_idx = addr >> amdgpu_vm_block_size;
			
 
				+	pt = vm->page_tables[pt_idx].entry.robj;
			
 
				+
			
 
				+	if ((addr & ~mask) == (end & ~mask))
			
 
				+		nptes = end - addr;
			
 
				+	else
			
 
				+		nptes = AMDGPU_VM_PTE_COUNT - (addr & mask);
			
 
				+
			
 
				+	cur_pe_start = amdgpu_bo_gpu_offset(pt);
			
 
				+	cur_pe_start += (addr & mask) * 8;
			
 
				+	cur_pe_end = cur_pe_start + 8 * nptes;
			
 
				+	cur_dst = dst;
			
 
				+
			
 
				+	/* for next ptb*/
			
 
				+	addr += nptes;
			
 
				+	dst += nptes * AMDGPU_GPU_PAGE_SIZE;
			
 
				 
			
 
				 	/* walk over the address space and update the page tables */
			
 
				-	for (addr = start; addr < end; ) {
			
 
				-		uint64_t pt_idx = addr >> amdgpu_vm_block_size;
			
 
				-		struct amdgpu_bo *pt = vm->page_tables[pt_idx].entry.robj;
			
 
				-		unsigned nptes;
			
 
				-		uint64_t pe_start;
			
 
				+	while (addr < end) {
			
 
				+		pt_idx = addr >> amdgpu_vm_block_size;
			
 
				+		pt = vm->page_tables[pt_idx].entry.robj;
			
 
				 
			
 
				 		if ((addr & ~mask) == (end & ~mask))
			
 
				 			nptes = end - addr;
			
 
				 		else
			
 
				 			nptes = AMDGPU_VM_PTE_COUNT - (addr & mask);
			
 
				 
			
 
				-		pe_start = amdgpu_bo_gpu_offset(pt);
			
 
				-		pe_start += (addr & mask) * 8;
			
 
				-
			
 
				-		if (last_pe_end != pe_start) {
			
 
				+		next_pe_start = amdgpu_bo_gpu_offset(pt);
			
 
				+		next_pe_start += (addr & mask) * 8;
			
 
				 
			
 
				+		if (cur_pe_end == next_pe_start) {
			
 
				+			/* The next ptb is consecutive to current ptb.
			
 
				+			 * Don't call amdgpu_vm_frag_ptes now.
			
 
				+			 * Will update two ptbs together in future.
			
 
				+			*/
			
 
				+			cur_pe_end += 8 * nptes;
			
 
				+		} else {
			
 
				 			amdgpu_vm_frag_ptes(adev, vm_update_params,
			
 
				-					    last_pe_start, last_pe_end,
			
 
				-					    last_dst, flags);
			
 
				+					    cur_pe_start, cur_pe_end,
			
 
				+					    cur_dst, flags);
			
 
				 
			
 
				-			last_pe_start = pe_start;
			
 
				-			last_pe_end = pe_start + 8 * nptes;
			
 
				-			last_dst = dst;
			
 
				-		} else {
			
 
				-			last_pe_end += 8 * nptes;
			
 
				+			cur_pe_start = next_pe_start;
			
 
				+			cur_pe_end = next_pe_start + 8 * nptes;
			
 
				+			cur_dst = dst;
			
 
				 		}
			
 
				 
			
 
				+		/* for next ptb*/
			
 
				 		addr += nptes;
			
 
				 		dst += nptes * AMDGPU_GPU_PAGE_SIZE;
			
 
				 	}
			
 
				 
			
 
				-	amdgpu_vm_frag_ptes(adev, vm_update_params, last_pe_start,
			
 
				-			    last_pe_end, last_dst, flags);
			
 
				+	amdgpu_vm_frag_ptes(adev, vm_update_params, cur_pe_start,
			
 
				+			    cur_pe_end, cur_dst, flags);
			
 
				 }
			
 
				 
			
 
				 /**
			
 
				  * amdgpu_vm_bo_update_mapping - update a mapping in the vm page table
			
 
				  *
			
 
				  * @adev: amdgpu_device pointer
			
 
				+ * @exclusive: fence we need to sync to
			
 
				  * @src: address where to copy page table entries from
			
 
				  * @pages_addr: DMA addresses to use for mapping
			
 
				  * @vm: requested vm
			
@@ -793,6 +885,7 @@ static void amdgpu_vm_update_ptes(struct amdgpu_device *adev,
 
				  * Returns 0 for success, -EINVAL for failure.
			
 
				  */
			
 
				 static int amdgpu_vm_bo_update_mapping(struct amdgpu_device *adev,
			
 
				+				       struct fence *exclusive,
			
 
				 				       uint64_t src,
			
 
				 				       dma_addr_t *pages_addr,
			
 
				 				       struct amdgpu_vm *vm,
			
@@ -853,6 +946,10 @@ static int amdgpu_vm_bo_update_mapping(struct amdgpu_device *adev,
 
				 
			
 
				 	vm_update_params.ib = &job->ibs[0];
			
 
				 
			
 
				+	r = amdgpu_sync_fence(adev, &job->sync, exclusive);
			
 
				+	if (r)
			
 
				+		goto error_free;
			
 
				+
			
 
				 	r = amdgpu_sync_resv(adev, &job->sync, vm->page_directory->tbo.resv,
			
 
				 			     owner);
			
 
				 	if (r)
			
@@ -889,6 +986,7 @@ error_free:
 
				  * amdgpu_vm_bo_split_mapping - split a mapping into smaller chunks
			
 
				  *
			
 
				  * @adev: amdgpu_device pointer
			
 
				+ * @exclusive: fence we need to sync to
			
 
				  * @gtt_flags: flags as they are used for GTT
			
 
				  * @pages_addr: DMA addresses to use for mapping
			
 
				  * @vm: requested vm
			
@@ -902,6 +1000,7 @@ error_free:
 
				  * Returns 0 for success, -EINVAL for failure.
			
 
				  */
			
 
				 static int amdgpu_vm_bo_split_mapping(struct amdgpu_device *adev,
			
 
				+				      struct fence *exclusive,
			
 
				 				      uint32_t gtt_flags,
			
 
				 				      dma_addr_t *pages_addr,
			
 
				 				      struct amdgpu_vm *vm,
			
@@ -932,7 +1031,8 @@ static int amdgpu_vm_bo_split_mapping(struct amdgpu_device *adev,
 
				 	addr += mapping->offset;
			
 
				 
			
 
				 	if (!pages_addr || src)
			
 
				-		return amdgpu_vm_bo_update_mapping(adev, src, pages_addr, vm,
			
 
				+		return amdgpu_vm_bo_update_mapping(adev, exclusive,
			
 
				+						   src, pages_addr, vm,
			
 
				 						   start, mapping->it.last,
			
 
				 						   flags, addr, fence);
			
 
				 
			
@@ -940,7 +1040,8 @@ static int amdgpu_vm_bo_split_mapping(struct amdgpu_device *adev,
 
				 		uint64_t last;
			
 
				 
			
 
				 		last = min((uint64_t)mapping->it.last, start + max_size - 1);
			
 
				-		r = amdgpu_vm_bo_update_mapping(adev, src, pages_addr, vm,
			
 
				+		r = amdgpu_vm_bo_update_mapping(adev, exclusive,
			
 
				+						src, pages_addr, vm,
			
 
				 						start, last, flags, addr,
			
 
				 						fence);
			
 
				 		if (r)
			
@@ -973,6 +1074,7 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev,
 
				 	struct amdgpu_bo_va_mapping *mapping;
			
 
				 	dma_addr_t *pages_addr = NULL;
			
 
				 	uint32_t gtt_flags, flags;
			
 
				+	struct fence *exclusive;
			
 
				 	uint64_t addr;
			
 
				 	int r;
			
 
				 
			
@@ -994,8 +1096,11 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev,
 
				 		default:
			
 
				 			break;
			
 
				 		}
			
 
				+
			
 
				+		exclusive = reservation_object_get_excl(bo_va->bo->tbo.resv);
			
 
				 	} else {
			
 
				 		addr = 0;
			
 
				+		exclusive = NULL;
			
 
				 	}
			
 
				 
			
 
				 	flags = amdgpu_ttm_tt_pte_flags(adev, bo_va->bo->tbo.ttm, mem);
			
@@ -1007,7 +1112,8 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev,
 
				 	spin_unlock(&vm->status_lock);
			
 
				 
			
 
				 	list_for_each_entry(mapping, &bo_va->invalids, list) {
			
 
				-		r = amdgpu_vm_bo_split_mapping(adev, gtt_flags, pages_addr, vm,
			
 
				+		r = amdgpu_vm_bo_split_mapping(adev, exclusive,
			
 
				+					       gtt_flags, pages_addr, vm,
			
 
				 					       mapping, flags, addr,
			
 
				 					       &bo_va->last_pt_update);
			
 
				 		if (r)
			
@@ -1054,7 +1160,7 @@ int amdgpu_vm_clear_freed(struct amdgpu_device *adev,
 
				 			struct amdgpu_bo_va_mapping, list);
			
 
				 		list_del(&mapping->list);
			
 
				 
			
 
				-		r = amdgpu_vm_bo_split_mapping(adev, 0, NULL, vm, mapping,
			
 
				+		r = amdgpu_vm_bo_split_mapping(adev, NULL, 0, NULL, vm, mapping,
			
 
				 					       0, 0, NULL);
			
 
				 		kfree(mapping);
			
 
				 		if (r)
			
@@ -1445,6 +1551,7 @@ int amdgpu_vm_init(struct amdgpu_device *adev, struct amdgpu_vm *vm)
 
				 	amdgpu_bo_unreserve(vm->page_directory);
			
 
				 	if (r)
			
 
				 		goto error_free_page_directory;
			
 
				+	vm->last_eviction_counter = atomic64_read(&adev->num_evictions);
			
 
				 
			
 
				 	return 0;
			
 
				 
			
@@ -1516,6 +1623,10 @@ void amdgpu_vm_manager_init(struct amdgpu_device *adev)
 
				 			      &adev->vm_manager.ids_lru);
			
 
				 	}
			
 
				 
			
 
				+	adev->vm_manager.fence_context = fence_context_alloc(AMDGPU_MAX_RINGS);
			
 
				+	for (i = 0; i < AMDGPU_MAX_RINGS; ++i)
			
 
				+		adev->vm_manager.seqno[i] = 0;
			
 
				+
			
 
				 	atomic_set(&adev->vm_manager.vm_pte_next_ring, 0);
			
 
				 	atomic64_set(&adev->vm_manager.client_counter, 0);
			
 
				 }
			
--- a/drivers/gpu/drm/amd/amdgpu/ci_dpm.c
+++ b/drivers/gpu/drm/amd/amdgpu/ci_dpm.c
@@ -50,7 +50,9 @@
 
				 #include "gmc/gmc_7_1_sh_mask.h"
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/bonaire_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/bonaire_k_smc.bin");
			
 
				 MODULE_FIRMWARE("radeon/hawaii_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/hawaii_k_smc.bin");
			
 
				 
			
 
				 #define MC_CG_ARB_FREQ_F0           0x0a
			
 
				 #define MC_CG_ARB_FREQ_F1           0x0b
			
@@ -736,19 +738,19 @@ static int ci_enable_didt(struct amdgpu_device *adev, bool enable)
 
				 
			
 
				 	if (pi->caps_sq_ramping || pi->caps_db_ramping ||
			
 
				 	    pi->caps_td_ramping || pi->caps_tcp_ramping) {
			
 
				-		gfx_v7_0_enter_rlc_safe_mode(adev);
			
 
				+		adev->gfx.rlc.funcs->enter_safe_mode(adev);
			
 
				 
			
 
				 		if (enable) {
			
 
				 			ret = ci_program_pt_config_registers(adev, didt_config_ci);
			
 
				 			if (ret) {
			
 
				-				gfx_v7_0_exit_rlc_safe_mode(adev);
			
 
				+				adev->gfx.rlc.funcs->exit_safe_mode(adev);
			
 
				 				return ret;
			
 
				 			}
			
 
				 		}
			
 
				 
			
 
				 		ci_do_enable_didt(adev, enable);
			
 
				 
			
 
				-		gfx_v7_0_exit_rlc_safe_mode(adev);
			
 
				+		adev->gfx.rlc.funcs->exit_safe_mode(adev);
			
 
				 	}
			
 
				 
			
 
				 	return 0;
			
@@ -3636,6 +3638,10 @@ static int ci_setup_default_dpm_tables(struct amdgpu_device *adev)
 
				 
			
 
				 	ci_setup_default_pcie_tables(adev);
			
 
				 
			
 
				+	/* save a copy of the default DPM table */
			
 
				+	memcpy(&(pi->golden_dpm_table), &(pi->dpm_table),
			
 
				+			sizeof(struct ci_dpm_table));
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -5754,10 +5760,18 @@ static int ci_dpm_init_microcode(struct amdgpu_device *adev)
 
				 
			
 
				 	switch (adev->asic_type) {
			
 
				 	case CHIP_BONAIRE:
			
 
				-		chip_name = "bonaire";
			
 
				+		if ((adev->pdev->revision == 0x80) ||
			
 
				+		    (adev->pdev->revision == 0x81) ||
			
 
				+		    (adev->pdev->device == 0x665f))
			
 
				+			chip_name = "bonaire_k";
			
 
				+		else
			
 
				+			chip_name = "bonaire";
			
 
				 		break;
			
 
				 	case CHIP_HAWAII:
			
 
				-		chip_name = "hawaii";
			
 
				+		if (adev->pdev->revision == 0x80)
			
 
				+			chip_name = "hawaii_k";
			
 
				+		else
			
 
				+			chip_name = "hawaii";
			
 
				 		break;
			
 
				 	case CHIP_KAVERI:
			
 
				 	case CHIP_KABINI:
			
@@ -6404,6 +6418,186 @@ static int ci_dpm_set_powergating_state(void *handle,
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int ci_dpm_print_clock_levels(struct amdgpu_device *adev,
			
 
				+		enum pp_clock_type type, char *buf)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+	struct ci_single_dpm_table *sclk_table = &pi->dpm_table.sclk_table;
			
 
				+	struct ci_single_dpm_table *mclk_table = &pi->dpm_table.mclk_table;
			
 
				+	struct ci_single_dpm_table *pcie_table = &pi->dpm_table.pcie_speed_table;
			
 
				+
			
 
				+	int i, now, size = 0;
			
 
				+	uint32_t clock, pcie_speed;
			
 
				+
			
 
				+	switch (type) {
			
 
				+	case PP_SCLK:
			
 
				+		amdgpu_ci_send_msg_to_smc(adev, PPSMC_MSG_API_GetSclkFrequency);
			
 
				+		clock = RREG32(mmSMC_MSG_ARG_0);
			
 
				+
			
 
				+		for (i = 0; i < sclk_table->count; i++) {
			
 
				+			if (clock > sclk_table->dpm_levels[i].value)
			
 
				+				continue;
			
 
				+			break;
			
 
				+		}
			
 
				+		now = i;
			
 
				+
			
 
				+		for (i = 0; i < sclk_table->count; i++)
			
 
				+			size += sprintf(buf + size, "%d: %uMhz %s\n",
			
 
				+					i, sclk_table->dpm_levels[i].value / 100,
			
 
				+					(i == now) ? "*" : "");
			
 
				+		break;
			
 
				+	case PP_MCLK:
			
 
				+		amdgpu_ci_send_msg_to_smc(adev, PPSMC_MSG_API_GetMclkFrequency);
			
 
				+		clock = RREG32(mmSMC_MSG_ARG_0);
			
 
				+
			
 
				+		for (i = 0; i < mclk_table->count; i++) {
			
 
				+			if (clock > mclk_table->dpm_levels[i].value)
			
 
				+				continue;
			
 
				+			break;
			
 
				+		}
			
 
				+		now = i;
			
 
				+
			
 
				+		for (i = 0; i < mclk_table->count; i++)
			
 
				+			size += sprintf(buf + size, "%d: %uMhz %s\n",
			
 
				+					i, mclk_table->dpm_levels[i].value / 100,
			
 
				+					(i == now) ? "*" : "");
			
 
				+		break;
			
 
				+	case PP_PCIE:
			
 
				+		pcie_speed = ci_get_current_pcie_speed(adev);
			
 
				+		for (i = 0; i < pcie_table->count; i++) {
			
 
				+			if (pcie_speed != pcie_table->dpm_levels[i].value)
			
 
				+				continue;
			
 
				+			break;
			
 
				+		}
			
 
				+		now = i;
			
 
				+
			
 
				+		for (i = 0; i < pcie_table->count; i++)
			
 
				+			size += sprintf(buf + size, "%d: %s %s\n", i,
			
 
				+					(pcie_table->dpm_levels[i].value == 0) ? "2.5GB, x1" :
			
 
				+					(pcie_table->dpm_levels[i].value == 1) ? "5.0GB, x16" :
			
 
				+					(pcie_table->dpm_levels[i].value == 2) ? "8.0GB, x16" : "",
			
 
				+					(i == now) ? "*" : "");
			
 
				+		break;
			
 
				+	default:
			
 
				+		break;
			
 
				+	}
			
 
				+
			
 
				+	return size;
			
 
				+}
			
 
				+
			
 
				+static int ci_dpm_force_clock_level(struct amdgpu_device *adev,
			
 
				+		enum pp_clock_type type, uint32_t mask)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+
			
 
				+	if (adev->pm.dpm.forced_level
			
 
				+			!= AMDGPU_DPM_FORCED_LEVEL_MANUAL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	switch (type) {
			
 
				+	case PP_SCLK:
			
 
				+		if (!pi->sclk_dpm_key_disabled)
			
 
				+			amdgpu_ci_send_msg_to_smc_with_parameter(adev,
			
 
				+					PPSMC_MSG_SCLKDPM_SetEnabledMask,
			
 
				+					pi->dpm_level_enable_mask.sclk_dpm_enable_mask & mask);
			
 
				+		break;
			
 
				+
			
 
				+	case PP_MCLK:
			
 
				+		if (!pi->mclk_dpm_key_disabled)
			
 
				+			amdgpu_ci_send_msg_to_smc_with_parameter(adev,
			
 
				+					PPSMC_MSG_MCLKDPM_SetEnabledMask,
			
 
				+					pi->dpm_level_enable_mask.mclk_dpm_enable_mask & mask);
			
 
				+		break;
			
 
				+
			
 
				+	case PP_PCIE:
			
 
				+	{
			
 
				+		uint32_t tmp = mask & pi->dpm_level_enable_mask.pcie_dpm_enable_mask;
			
 
				+		uint32_t level = 0;
			
 
				+
			
 
				+		while (tmp >>= 1)
			
 
				+			level++;
			
 
				+
			
 
				+		if (!pi->pcie_dpm_key_disabled)
			
 
				+			amdgpu_ci_send_msg_to_smc_with_parameter(adev,
			
 
				+					PPSMC_MSG_PCIeDPM_ForceLevel,
			
 
				+					level);
			
 
				+		break;
			
 
				+	}
			
 
				+	default:
			
 
				+		break;
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int ci_dpm_get_sclk_od(struct amdgpu_device *adev)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+	struct ci_single_dpm_table *sclk_table = &(pi->dpm_table.sclk_table);
			
 
				+	struct ci_single_dpm_table *golden_sclk_table =
			
 
				+			&(pi->golden_dpm_table.sclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (sclk_table->dpm_levels[sclk_table->count - 1].value -
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int ci_dpm_set_sclk_od(struct amdgpu_device *adev, uint32_t value)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+	struct ci_ps *ps = ci_get_ps(adev->pm.dpm.requested_ps);
			
 
				+	struct ci_single_dpm_table *golden_sclk_table =
			
 
				+			&(pi->golden_dpm_table.sclk_table);
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps->performance_levels[ps->performance_level_count - 1].sclk =
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int ci_dpm_get_mclk_od(struct amdgpu_device *adev)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+	struct ci_single_dpm_table *mclk_table = &(pi->dpm_table.mclk_table);
			
 
				+	struct ci_single_dpm_table *golden_mclk_table =
			
 
				+			&(pi->golden_dpm_table.mclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (mclk_table->dpm_levels[mclk_table->count - 1].value -
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int ci_dpm_set_mclk_od(struct amdgpu_device *adev, uint32_t value)
			
 
				+{
			
 
				+	struct ci_power_info *pi = ci_get_pi(adev);
			
 
				+	struct ci_ps *ps = ci_get_ps(adev->pm.dpm.requested_ps);
			
 
				+	struct ci_single_dpm_table *golden_mclk_table =
			
 
				+			&(pi->golden_dpm_table.mclk_table);
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps->performance_levels[ps->performance_level_count - 1].mclk =
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 const struct amd_ip_funcs ci_dpm_ip_funcs = {
			
 
				 	.name = "ci_dpm",
			
 
				 	.early_init = ci_dpm_early_init,
			
@@ -6438,6 +6632,12 @@ static const struct amdgpu_dpm_funcs ci_dpm_funcs = {
 
				 	.get_fan_control_mode = &ci_dpm_get_fan_control_mode,
			
 
				 	.set_fan_speed_percent = &ci_dpm_set_fan_speed_percent,
			
 
				 	.get_fan_speed_percent = &ci_dpm_get_fan_speed_percent,
			
 
				+	.print_clock_levels = ci_dpm_print_clock_levels,
			
 
				+	.force_clock_level = ci_dpm_force_clock_level,
			
 
				+	.get_sclk_od = ci_dpm_get_sclk_od,
			
 
				+	.set_sclk_od = ci_dpm_set_sclk_od,
			
 
				+	.get_mclk_od = ci_dpm_get_mclk_od,
			
 
				+	.set_mclk_od = ci_dpm_set_mclk_od,
			
 
				 };
			
 
				 
			
 
				 static void ci_dpm_set_dpm_funcs(struct amdgpu_device *adev)
			
--- a/drivers/gpu/drm/amd/amdgpu/ci_dpm.h
+++ b/drivers/gpu/drm/amd/amdgpu/ci_dpm.h
@@ -193,6 +193,7 @@ struct ci_pt_defaults {
 
				 
			
 
				 struct ci_power_info {
			
 
				 	struct ci_dpm_table dpm_table;
			
 
				+	struct ci_dpm_table golden_dpm_table;
			
 
				 	u32 voltage_control;
			
 
				 	u32 mvdd_control;
			
 
				 	u32 vddci_control;
			
--- a/drivers/gpu/drm/amd/amdgpu/cik.c
+++ b/drivers/gpu/drm/amd/amdgpu/cik.c
@@ -1035,12 +1035,12 @@ static uint32_t cik_read_indexed_register(struct amdgpu_device *adev,
 
				 
			
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	if (se_num != 0xffffffff || sh_num != 0xffffffff)
			
 
				-		gfx_v7_0_select_se_sh(adev, se_num, sh_num);
			
 
				+		amdgpu_gfx_select_se_sh(adev, se_num, sh_num, 0xffffffff);
			
 
				 
			
 
				 	val = RREG32(reg_offset);
			
 
				 
			
 
				 	if (se_num != 0xffffffff || sh_num != 0xffffffff)
			
 
				-		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+		amdgpu_gfx_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 	return val;
			
 
				 }
			
@@ -1158,10 +1158,11 @@ static void kv_restore_regs_for_reset(struct amdgpu_device *adev,
 
				 	WREG32(mmGMCON_RENG_EXECUTE, save->gmcon_reng_execute);
			
 
				 }
			
 
				 
			
 
				-static void cik_gpu_pci_config_reset(struct amdgpu_device *adev)
			
 
				+static int cik_gpu_pci_config_reset(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	struct kv_reset_save_regs kv_save = { 0 };
			
 
				 	u32 i;
			
 
				+	int r = -EINVAL;
			
 
				 
			
 
				 	dev_info(adev->dev, "GPU pci config reset\n");
			
 
				 
			
@@ -1177,14 +1178,20 @@ static void cik_gpu_pci_config_reset(struct amdgpu_device *adev)
 
				 
			
 
				 	/* wait for asic to come out of reset */
			
 
				 	for (i = 0; i < adev->usec_timeout; i++) {
			
 
				-		if (RREG32(mmCONFIG_MEMSIZE) != 0xffffffff)
			
 
				+		if (RREG32(mmCONFIG_MEMSIZE) != 0xffffffff) {
			
 
				+			/* enable BM */
			
 
				+			pci_set_master(adev->pdev);
			
 
				+			r = 0;
			
 
				 			break;
			
 
				+		}
			
 
				 		udelay(1);
			
 
				 	}
			
 
				 
			
 
				 	/* does asic init need to be run first??? */
			
 
				 	if (adev->flags & AMD_IS_APU)
			
 
				 		kv_restore_regs_for_reset(adev, &kv_save);
			
 
				+
			
 
				+	return r;
			
 
				 }
			
 
				 
			
 
				 static void cik_set_bios_scratch_engine_hung(struct amdgpu_device *adev, bool hung)
			
@@ -1210,13 +1217,14 @@ static void cik_set_bios_scratch_engine_hung(struct amdgpu_device *adev, bool hu
 
				  */
			
 
				 static int cik_asic_reset(struct amdgpu_device *adev)
			
 
				 {
			
 
				+	int r;
			
 
				 	cik_set_bios_scratch_engine_hung(adev, true);
			
 
				 
			
 
				-	cik_gpu_pci_config_reset(adev);
			
 
				+	r = cik_gpu_pci_config_reset(adev);
			
 
				 
			
 
				 	cik_set_bios_scratch_engine_hung(adev, false);
			
 
				 
			
 
				-	return 0;
			
 
				+	return r;
			
 
				 }
			
 
				 
			
 
				 static int cik_set_uvd_clock(struct amdgpu_device *adev, u32 clock,
			
@@ -2014,9 +2022,6 @@ static const struct amdgpu_asic_funcs cik_asic_funcs =
 
				 	.set_uvd_clocks = &cik_set_uvd_clocks,
			
 
				 	.set_vce_clocks = &cik_set_vce_clocks,
			
 
				 	.get_virtual_caps = &cik_get_virtual_caps,
			
 
				-	/* these should be moved to their own ip modules */
			
 
				-	.get_gpu_clock_counter = &gfx_v7_0_get_gpu_clock_counter,
			
 
				-	.wait_for_mc_idle = &gmc_v7_0_mc_wait_for_idle,
			
 
				 };
			
 
				 
			
 
				 static int cik_common_early_init(void *handle)
			
--- a/drivers/gpu/drm/amd/amdgpu/cik_sdma.c
+++ b/drivers/gpu/drm/amd/amdgpu/cik_sdma.c
@@ -224,17 +224,6 @@ static void cik_sdma_ring_emit_ib(struct amdgpu_ring *ring,
 
				 				  unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				 	u32 extra_bits = vm_id & 0xf;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	while ((next_rptr & 7) != 4)
			
 
				-		next_rptr++;
			
 
				-
			
 
				-	next_rptr += 4;
			
 
				-	amdgpu_ring_write(ring, SDMA_PACKET(SDMA_OPCODE_WRITE, SDMA_WRITE_SUB_OPCODE_LINEAR, 0));
			
 
				-	amdgpu_ring_write(ring, ring->next_rptr_gpu_addr & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr) & 0xffffffff);
			
 
				-	amdgpu_ring_write(ring, 1); /* number of DWs to follow */
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				 
			
 
				 	/* IB packet must end on a 8 DW boundary */
			
 
				 	cik_sdma_ring_insert_nop(ring, (12 - (ring->wptr & 7)) % 8);
			
--- a/drivers/gpu/drm/amd/amdgpu/cz_dpm.c
+++ b/drivers/gpu/drm/amd/amdgpu/cz_dpm.c
@@ -2219,6 +2219,7 @@ static void cz_dpm_powergate_vce(struct amdgpu_device *adev, bool gate)
 
				 			}
			
 
				 		}
			
 
				 	} else { /*pi->caps_vce_pg*/
			
 
				+		pi->vce_power_gated = gate;
			
 
				 		cz_update_vce_dpm(adev);
			
 
				 		cz_enable_vce_dpm(adev, !gate);
			
 
				 	}
			
--- a/drivers/gpu/drm/amd/amdgpu/dce_v11_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/dce_v11_0.c
@@ -307,11 +307,10 @@ static void dce_v11_0_page_flip(struct amdgpu_device *adev,
 
				 	struct amdgpu_crtc *amdgpu_crtc = adev->mode_info.crtcs[crtc_id];
			
 
				 	u32 tmp;
			
 
				 
			
 
				-	/* flip at hsync for async, default is vsync */
			
 
				-	/* use UPDATE_IMMEDIATE_EN instead for async? */
			
 
				+	/* flip immediate for async, default is vsync */
			
 
				 	tmp = RREG32(mmGRPH_FLIP_CONTROL + amdgpu_crtc->crtc_offset);
			
 
				 	tmp = REG_SET_FIELD(tmp, GRPH_FLIP_CONTROL,
			
 
				-			    GRPH_SURFACE_UPDATE_H_RETRACE_EN, async ? 1 : 0);
			
 
				+			    GRPH_SURFACE_UPDATE_IMMEDIATE_EN, async ? 1 : 0);
			
 
				 	WREG32(mmGRPH_FLIP_CONTROL + amdgpu_crtc->crtc_offset, tmp);
			
 
				 	/* update the scanout addresses */
			
 
				 	WREG32(mmGRPH_PRIMARY_SURFACE_ADDRESS_HIGH + amdgpu_crtc->crtc_offset,
			
--- a/drivers/gpu/drm/amd/amdgpu/dce_v8_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/dce_v8_0.c
@@ -526,36 +526,16 @@ static void dce_v8_0_stop_mc_access(struct amdgpu_device *adev,
 
				 		crtc_enabled = REG_GET_FIELD(RREG32(mmCRTC_CONTROL + crtc_offsets[i]),
			
 
				 					     CRTC_CONTROL, CRTC_MASTER_EN);
			
 
				 		if (crtc_enabled) {
			
 
				-#if 0
			
 
				-			u32 frame_count;
			
 
				-			int j;
			
 
				-
			
 
				+#if 1
			
 
				 			save->crtc_enabled[i] = true;
			
 
				 			tmp = RREG32(mmCRTC_BLANK_CONTROL + crtc_offsets[i]);
			
 
				 			if (REG_GET_FIELD(tmp, CRTC_BLANK_CONTROL, CRTC_BLANK_DATA_EN) == 0) {
			
 
				-				amdgpu_display_vblank_wait(adev, i);
			
 
				-				WREG32(mmCRTC_UPDATE_LOCK + crtc_offsets[i], 1);
			
 
				+				/*it is correct only for RGB ; black is 0*/
			
 
				+				WREG32(mmCRTC_BLANK_DATA_COLOR + crtc_offsets[i], 0);
			
 
				 				tmp = REG_SET_FIELD(tmp, CRTC_BLANK_CONTROL, CRTC_BLANK_DATA_EN, 1);
			
 
				 				WREG32(mmCRTC_BLANK_CONTROL + crtc_offsets[i], tmp);
			
 
				-				WREG32(mmCRTC_UPDATE_LOCK + crtc_offsets[i], 0);
			
 
				-			}
			
 
				-			/* wait for the next frame */
			
 
				-			frame_count = amdgpu_display_vblank_get_counter(adev, i);
			
 
				-			for (j = 0; j < adev->usec_timeout; j++) {
			
 
				-				if (amdgpu_display_vblank_get_counter(adev, i) != frame_count)
			
 
				-					break;
			
 
				-				udelay(1);
			
 
				-			}
			
 
				-			tmp = RREG32(mmGRPH_UPDATE + crtc_offsets[i]);
			
 
				-			if (REG_GET_FIELD(tmp, GRPH_UPDATE, GRPH_UPDATE_LOCK) == 0) {
			
 
				-				tmp = REG_SET_FIELD(tmp, GRPH_UPDATE, GRPH_UPDATE_LOCK, 1);
			
 
				-				WREG32(mmGRPH_UPDATE + crtc_offsets[i], tmp);
			
 
				-			}
			
 
				-			tmp = RREG32(mmMASTER_UPDATE_LOCK + crtc_offsets[i]);
			
 
				-			if (REG_GET_FIELD(tmp, MASTER_UPDATE_LOCK, MASTER_UPDATE_LOCK) == 0) {
			
 
				-				tmp = REG_SET_FIELD(tmp, MASTER_UPDATE_LOCK, MASTER_UPDATE_LOCK, 1);
			
 
				-				WREG32(mmMASTER_UPDATE_LOCK + crtc_offsets[i], tmp);
			
 
				 			}
			
 
				+			mdelay(20);
			
 
				 #else
			
 
				 			/* XXX this is a hack to avoid strange behavior with EFI on certain systems */
			
 
				 			WREG32(mmCRTC_UPDATE_LOCK + crtc_offsets[i], 1);
			
@@ -575,55 +555,22 @@ static void dce_v8_0_stop_mc_access(struct amdgpu_device *adev,
 
				 static void dce_v8_0_resume_mc_access(struct amdgpu_device *adev,
			
 
				 				      struct amdgpu_mode_mc_save *save)
			
 
				 {
			
 
				-	u32 tmp, frame_count;
			
 
				-	int i, j;
			
 
				+	u32 tmp;
			
 
				+	int i;
			
 
				 
			
 
				 	/* update crtc base addresses */
			
 
				 	for (i = 0; i < adev->mode_info.num_crtc; i++) {
			
 
				 		WREG32(mmGRPH_PRIMARY_SURFACE_ADDRESS_HIGH + crtc_offsets[i],
			
 
				 		       upper_32_bits(adev->mc.vram_start));
			
 
				-		WREG32(mmGRPH_SECONDARY_SURFACE_ADDRESS_HIGH + crtc_offsets[i],
			
 
				-		       upper_32_bits(adev->mc.vram_start));
			
 
				 		WREG32(mmGRPH_PRIMARY_SURFACE_ADDRESS + crtc_offsets[i],
			
 
				 		       (u32)adev->mc.vram_start);
			
 
				-		WREG32(mmGRPH_SECONDARY_SURFACE_ADDRESS + crtc_offsets[i],
			
 
				-		       (u32)adev->mc.vram_start);
			
 
				 
			
 
				 		if (save->crtc_enabled[i]) {
			
 
				-			tmp = RREG32(mmMASTER_UPDATE_MODE + crtc_offsets[i]);
			
 
				-			if (REG_GET_FIELD(tmp, MASTER_UPDATE_MODE, MASTER_UPDATE_MODE) != 3) {
			
 
				-				tmp = REG_SET_FIELD(tmp, MASTER_UPDATE_MODE, MASTER_UPDATE_MODE, 3);
			
 
				-				WREG32(mmMASTER_UPDATE_MODE + crtc_offsets[i], tmp);
			
 
				-			}
			
 
				-			tmp = RREG32(mmGRPH_UPDATE + crtc_offsets[i]);
			
 
				-			if (REG_GET_FIELD(tmp, GRPH_UPDATE, GRPH_UPDATE_LOCK)) {
			
 
				-				tmp = REG_SET_FIELD(tmp, GRPH_UPDATE, GRPH_UPDATE_LOCK, 0);
			
 
				-				WREG32(mmGRPH_UPDATE + crtc_offsets[i], tmp);
			
 
				-			}
			
 
				-			tmp = RREG32(mmMASTER_UPDATE_LOCK + crtc_offsets[i]);
			
 
				-			if (REG_GET_FIELD(tmp, MASTER_UPDATE_LOCK, MASTER_UPDATE_LOCK)) {
			
 
				-				tmp = REG_SET_FIELD(tmp, MASTER_UPDATE_LOCK, MASTER_UPDATE_LOCK, 0);
			
 
				-				WREG32(mmMASTER_UPDATE_LOCK + crtc_offsets[i], tmp);
			
 
				-			}
			
 
				-			for (j = 0; j < adev->usec_timeout; j++) {
			
 
				-				tmp = RREG32(mmGRPH_UPDATE + crtc_offsets[i]);
			
 
				-				if (REG_GET_FIELD(tmp, GRPH_UPDATE, GRPH_SURFACE_UPDATE_PENDING) == 0)
			
 
				-					break;
			
 
				-				udelay(1);
			
 
				-			}
			
 
				 			tmp = RREG32(mmCRTC_BLANK_CONTROL + crtc_offsets[i]);
			
 
				 			tmp = REG_SET_FIELD(tmp, CRTC_BLANK_CONTROL, CRTC_BLANK_DATA_EN, 0);
			
 
				-			WREG32(mmCRTC_UPDATE_LOCK + crtc_offsets[i], 1);
			
 
				 			WREG32(mmCRTC_BLANK_CONTROL + crtc_offsets[i], tmp);
			
 
				-			WREG32(mmCRTC_UPDATE_LOCK + crtc_offsets[i], 0);
			
 
				-			/* wait for the next frame */
			
 
				-			frame_count = amdgpu_display_vblank_get_counter(adev, i);
			
 
				-			for (j = 0; j < adev->usec_timeout; j++) {
			
 
				-				if (amdgpu_display_vblank_get_counter(adev, i) != frame_count)
			
 
				-					break;
			
 
				-				udelay(1);
			
 
				-			}
			
 
				 		}
			
 
				+		mdelay(20);
			
 
				 	}
			
 
				 
			
 
				 	WREG32(mmVGA_MEMORY_BASE_ADDRESS_HIGH, upper_32_bits(adev->mc.vram_start));
			
--- a/drivers/gpu/drm/amd/amdgpu/gfx_v7_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v7_0.c
@@ -1583,9 +1583,15 @@ static void gfx_v7_0_tiling_mode_table_init(struct amdgpu_device *adev)
 
				  * registers are instanced per SE or SH.  0xffffffff means
			
 
				  * broadcast to all SEs or SHs (CIK).
			
 
				  */
			
 
				-void gfx_v7_0_select_se_sh(struct amdgpu_device *adev, u32 se_num, u32 sh_num)
			
 
				+static void gfx_v7_0_select_se_sh(struct amdgpu_device *adev,
			
 
				+				  u32 se_num, u32 sh_num, u32 instance)
			
 
				 {
			
 
				-	u32 data = GRBM_GFX_INDEX__INSTANCE_BROADCAST_WRITES_MASK;
			
 
				+	u32 data;
			
 
				+
			
 
				+	if (instance == 0xffffffff)
			
 
				+		data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_BROADCAST_WRITES, 1);
			
 
				+	else
			
 
				+		data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_INDEX, instance);
			
 
				 
			
 
				 	if ((se_num == 0xffffffff) && (sh_num == 0xffffffff))
			
 
				 		data |= GRBM_GFX_INDEX__SH_BROADCAST_WRITES_MASK |
			
@@ -1659,13 +1665,13 @@ static void gfx_v7_0_setup_rb(struct amdgpu_device *adev)
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				-			gfx_v7_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v7_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				 			data = gfx_v7_0_get_rb_active_bitmap(adev);
			
 
				 			active_rbs |= data << ((i * adev->gfx.config.max_sh_per_se + j) *
			
 
				 					       rb_bitmap_width_per_sh);
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	adev->gfx.config.backend_enable_mask = active_rbs;
			
@@ -1746,7 +1752,7 @@ static void gfx_v7_0_gpu_init(struct amdgpu_device *adev)
 
				 	 * making sure that the following register writes will be broadcasted
			
 
				 	 * to all the shaders
			
 
				 	 */
			
 
				-	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 
			
 
				 	/* XXX SH_MEM regs */
			
 
				 	/* where to put LDS, scratch, GPUVM in FSA64 space */
			
@@ -2050,17 +2056,6 @@ static void gfx_v7_0_ring_emit_ib_gfx(struct amdgpu_ring *ring,
 
				 				      unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				 	u32 header, control = 0;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	if (ctx_switch)
			
 
				-		next_rptr += 2;
			
 
				-
			
 
				-	next_rptr += 4;
			
 
				-	amdgpu_ring_write(ring, PACKET3(PACKET3_WRITE_DATA, 3));
			
 
				-	amdgpu_ring_write(ring, WRITE_DATA_DST_SEL(5) | WR_CONFIRM);
			
 
				-	amdgpu_ring_write(ring, ring->next_rptr_gpu_addr & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr) & 0xffffffff);
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				 
			
 
				 	/* insert SWITCH_BUFFER packet before first IB in the ring frame */
			
 
				 	if (ctx_switch) {
			
@@ -2089,22 +2084,9 @@ static void gfx_v7_0_ring_emit_ib_compute(struct amdgpu_ring *ring,
 
				 					  struct amdgpu_ib *ib,
			
 
				 					  unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				-	u32 header, control = 0;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				+	u32 control = INDIRECT_BUFFER_VALID | ib->length_dw | (vm_id << 24);
			
 
				 
			
 
				-	control |= INDIRECT_BUFFER_VALID;
			
 
				-	next_rptr += 4;
			
 
				-	amdgpu_ring_write(ring, PACKET3(PACKET3_WRITE_DATA, 3));
			
 
				-	amdgpu_ring_write(ring, WRITE_DATA_DST_SEL(5) | WR_CONFIRM);
			
 
				-	amdgpu_ring_write(ring, ring->next_rptr_gpu_addr & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr) & 0xffffffff);
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				-
			
 
				-	header = PACKET3(PACKET3_INDIRECT_BUFFER, 2);
			
 
				-
			
 
				-	control |= ib->length_dw | (vm_id << 24);
			
 
				-
			
 
				-	amdgpu_ring_write(ring, header);
			
 
				+	amdgpu_ring_write(ring, PACKET3(PACKET3_INDIRECT_BUFFER, 2));
			
 
				 	amdgpu_ring_write(ring,
			
 
				 #ifdef __BIG_ENDIAN
			
 
				 					  (2 << 0) |
			
@@ -3221,7 +3203,8 @@ static int gfx_v7_0_rlc_init(struct amdgpu_device *adev)
 
				 		}
			
 
				 	}
			
 
				 	adev->gfx.rlc.cs_data = ci_cs_data;
			
 
				-	adev->gfx.rlc.cp_table_size = CP_ME_TABLE_SIZE * 5 * 4;
			
 
				+	adev->gfx.rlc.cp_table_size = ALIGN(CP_ME_TABLE_SIZE * 5 * 4, 2048); /* CP JT */
			
 
				+	adev->gfx.rlc.cp_table_size += 64 * 1024; /* GDS */
			
 
				 
			
 
				 	src_ptr = adev->gfx.rlc.reg_list;
			
 
				 	dws = adev->gfx.rlc.reg_list_size;
			
@@ -3379,7 +3362,7 @@ static void gfx_v7_0_wait_for_rlc_serdes(struct amdgpu_device *adev)
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				-			gfx_v7_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v7_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				 			for (k = 0; k < adev->usec_timeout; k++) {
			
 
				 				if (RREG32(mmRLC_SERDES_CU_MASTER_BUSY) == 0)
			
 
				 					break;
			
@@ -3387,7 +3370,7 @@ static void gfx_v7_0_wait_for_rlc_serdes(struct amdgpu_device *adev)
 
				 			}
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	mask = RLC_SERDES_NONCU_MASTER_BUSY__SE_MASTER_BUSY_MASK |
			
@@ -3434,7 +3417,7 @@ static u32 gfx_v7_0_halt_rlc(struct amdgpu_device *adev)
 
				 	return orig;
			
 
				 }
			
 
				 
			
 
				-void gfx_v7_0_enter_rlc_safe_mode(struct amdgpu_device *adev)
			
 
				+static void gfx_v7_0_enter_rlc_safe_mode(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 tmp, i, mask;
			
 
				 
			
@@ -3456,7 +3439,7 @@ void gfx_v7_0_enter_rlc_safe_mode(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				-void gfx_v7_0_exit_rlc_safe_mode(struct amdgpu_device *adev)
			
 
				+static void gfx_v7_0_exit_rlc_safe_mode(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 tmp;
			
 
				 
			
@@ -3471,7 +3454,7 @@ void gfx_v7_0_exit_rlc_safe_mode(struct amdgpu_device *adev)
 
				  *
			
 
				  * Halt the RLC ME (MicroEngine) (CIK).
			
 
				  */
			
 
				-void gfx_v7_0_rlc_stop(struct amdgpu_device *adev)
			
 
				+static void gfx_v7_0_rlc_stop(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	WREG32(mmRLC_CNTL, 0);
			
 
				 
			
@@ -3547,7 +3530,7 @@ static int gfx_v7_0_rlc_resume(struct amdgpu_device *adev)
 
				 	WREG32(mmRLC_LB_CNTR_MAX, 0x00008000);
			
 
				 
			
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				-	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	WREG32(mmRLC_LB_INIT_CU_MASK, 0xffffffff);
			
 
				 	WREG32(mmRLC_LB_PARAMS, 0x00600408);
			
 
				 	WREG32(mmRLC_LB_CNTL, 0x80000004);
			
@@ -3587,7 +3570,7 @@ static void gfx_v7_0_enable_cgcg(struct amdgpu_device *adev, bool enable)
 
				 		tmp = gfx_v7_0_halt_rlc(adev);
			
 
				 
			
 
				 		mutex_lock(&adev->grbm_idx_mutex);
			
 
				-		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_CU_MASTER_MASK, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_NONCU_MASTER_MASK, 0xffffffff);
			
 
				 		tmp2 = RLC_SERDES_WR_CTRL__BPM_ADDR_MASK |
			
@@ -3638,7 +3621,7 @@ static void gfx_v7_0_enable_mgcg(struct amdgpu_device *adev, bool enable)
 
				 		tmp = gfx_v7_0_halt_rlc(adev);
			
 
				 
			
 
				 		mutex_lock(&adev->grbm_idx_mutex);
			
 
				-		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_CU_MASTER_MASK, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_NONCU_MASTER_MASK, 0xffffffff);
			
 
				 		data = RLC_SERDES_WR_CTRL__BPM_ADDR_MASK |
			
@@ -3689,7 +3672,7 @@ static void gfx_v7_0_enable_mgcg(struct amdgpu_device *adev, bool enable)
 
				 		tmp = gfx_v7_0_halt_rlc(adev);
			
 
				 
			
 
				 		mutex_lock(&adev->grbm_idx_mutex);
			
 
				-		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+		gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_CU_MASTER_MASK, 0xffffffff);
			
 
				 		WREG32(mmRLC_SERDES_WR_NONCU_MASTER_MASK, 0xffffffff);
			
 
				 		data = RLC_SERDES_WR_CTRL__BPM_ADDR_MASK | RLC_SERDES_WR_CTRL__MGCG_OVERRIDE_1_MASK;
			
@@ -3867,6 +3850,20 @@ static void gfx_v7_0_enable_gfx_cgpg(struct amdgpu_device *adev,
 
				 	}
			
 
				 }
			
 
				 
			
 
				+static void gfx_v7_0_set_user_cu_inactive_bitmap(struct amdgpu_device *adev,
			
 
				+						 u32 bitmap)
			
 
				+{
			
 
				+	u32 data;
			
 
				+
			
 
				+	if (!bitmap)
			
 
				+		return;
			
 
				+
			
 
				+	data = bitmap << GC_USER_SHADER_ARRAY_CONFIG__INACTIVE_CUS__SHIFT;
			
 
				+	data &= GC_USER_SHADER_ARRAY_CONFIG__INACTIVE_CUS_MASK;
			
 
				+
			
 
				+	WREG32(mmGC_USER_SHADER_ARRAY_CONFIG, data);
			
 
				+}
			
 
				+
			
 
				 static u32 gfx_v7_0_get_cu_active_bitmap(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 data, mask;
			
@@ -4123,7 +4120,7 @@ static void gfx_v7_0_fini_pg(struct amdgpu_device *adev)
 
				  * Fetches a GPU clock counter snapshot (SI).
			
 
				  * Returns the 64 bit clock counter snapshot.
			
 
				  */
			
 
				-uint64_t gfx_v7_0_get_gpu_clock_counter(struct amdgpu_device *adev)
			
 
				+static uint64_t gfx_v7_0_get_gpu_clock_counter(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	uint64_t clock;
			
 
				 
			
@@ -4183,12 +4180,24 @@ static void gfx_v7_0_ring_emit_gds_switch(struct amdgpu_ring *ring,
 
				 	amdgpu_ring_write(ring, (1 << (oa_size + oa_base)) - (1 << oa_base));
			
 
				 }
			
 
				 
			
 
				+static const struct amdgpu_gfx_funcs gfx_v7_0_gfx_funcs = {
			
 
				+	.get_gpu_clock_counter = &gfx_v7_0_get_gpu_clock_counter,
			
 
				+	.select_se_sh = &gfx_v7_0_select_se_sh,
			
 
				+};
			
 
				+
			
 
				+static const struct amdgpu_rlc_funcs gfx_v7_0_rlc_funcs = {
			
 
				+	.enter_safe_mode = gfx_v7_0_enter_rlc_safe_mode,
			
 
				+	.exit_safe_mode = gfx_v7_0_exit_rlc_safe_mode
			
 
				+};
			
 
				+
			
 
				 static int gfx_v7_0_early_init(void *handle)
			
 
				 {
			
 
				 	struct amdgpu_device *adev = (struct amdgpu_device *)handle;
			
 
				 
			
 
				 	adev->gfx.num_gfx_rings = GFX7_NUM_GFX_RINGS;
			
 
				 	adev->gfx.num_compute_rings = GFX7_NUM_COMPUTE_RINGS;
			
 
				+	adev->gfx.funcs = &gfx_v7_0_gfx_funcs;
			
 
				+	adev->gfx.rlc.funcs = &gfx_v7_0_rlc_funcs;
			
 
				 	gfx_v7_0_set_ring_funcs(adev);
			
 
				 	gfx_v7_0_set_irq_funcs(adev);
			
 
				 	gfx_v7_0_set_gds_init(adev);
			
@@ -5032,16 +5041,22 @@ static void gfx_v7_0_get_cu_info(struct amdgpu_device *adev)
 
				 	int i, j, k, counter, active_cu_number = 0;
			
 
				 	u32 mask, bitmap, ao_bitmap, ao_cu_mask = 0;
			
 
				 	struct amdgpu_cu_info *cu_info = &adev->gfx.cu_info;
			
 
				+	unsigned disable_masks[4 * 2];
			
 
				 
			
 
				 	memset(cu_info, 0, sizeof(*cu_info));
			
 
				 
			
 
				+	amdgpu_gfx_parse_disable_cu(disable_masks, 4, 2);
			
 
				+
			
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				 			mask = 1;
			
 
				 			ao_bitmap = 0;
			
 
				 			counter = 0;
			
 
				-			gfx_v7_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v7_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				+			if (i < 4 && j < 2)
			
 
				+				gfx_v7_0_set_user_cu_inactive_bitmap(
			
 
				+					adev, disable_masks[i * 2 + j]);
			
 
				 			bitmap = gfx_v7_0_get_cu_active_bitmap(adev);
			
 
				 			cu_info->bitmap[i][j] = bitmap;
			
 
				 
			
@@ -5057,7 +5072,7 @@ static void gfx_v7_0_get_cu_info(struct amdgpu_device *adev)
 
				 			ao_cu_mask |= (ao_bitmap << (i * 16 + j * 8));
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v7_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	cu_info->number = active_cu_number;
			
--- a/drivers/gpu/drm/amd/amdgpu/gfx_v7_0.h
+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v7_0.h
@@ -26,11 +26,4 @@
 
				 
			
 
				 extern const struct amd_ip_funcs gfx_v7_0_ip_funcs;
			
 
				 
			
 
				-/* XXX these shouldn't be exported */
			
 
				-void gfx_v7_0_enter_rlc_safe_mode(struct amdgpu_device *adev);
			
 
				-void gfx_v7_0_exit_rlc_safe_mode(struct amdgpu_device *adev);
			
 
				-void gfx_v7_0_rlc_stop(struct amdgpu_device *adev);
			
 
				-uint64_t gfx_v7_0_get_gpu_clock_counter(struct amdgpu_device *adev);
			
 
				-void gfx_v7_0_select_se_sh(struct amdgpu_device *adev, u32 se_num, u32 sh_num);
			
 
				-
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.c
@@ -1150,6 +1150,71 @@ static void gfx_v8_0_get_csb_buffer(struct amdgpu_device *adev,
 
				 	buffer[count++] = cpu_to_le32(0);
			
 
				 }
			
 
				 
			
 
				+static void cz_init_cp_jump_table(struct amdgpu_device *adev)
			
 
				+{
			
 
				+	const __le32 *fw_data;
			
 
				+	volatile u32 *dst_ptr;
			
 
				+	int me, i, max_me = 4;
			
 
				+	u32 bo_offset = 0;
			
 
				+	u32 table_offset, table_size;
			
 
				+
			
 
				+	if (adev->asic_type == CHIP_CARRIZO)
			
 
				+		max_me = 5;
			
 
				+
			
 
				+	/* write the cp table buffer */
			
 
				+	dst_ptr = adev->gfx.rlc.cp_table_ptr;
			
 
				+	for (me = 0; me < max_me; me++) {
			
 
				+		if (me == 0) {
			
 
				+			const struct gfx_firmware_header_v1_0 *hdr =
			
 
				+				(const struct gfx_firmware_header_v1_0 *)adev->gfx.ce_fw->data;
			
 
				+			fw_data = (const __le32 *)
			
 
				+				(adev->gfx.ce_fw->data +
			
 
				+				 le32_to_cpu(hdr->header.ucode_array_offset_bytes));
			
 
				+			table_offset = le32_to_cpu(hdr->jt_offset);
			
 
				+			table_size = le32_to_cpu(hdr->jt_size);
			
 
				+		} else if (me == 1) {
			
 
				+			const struct gfx_firmware_header_v1_0 *hdr =
			
 
				+				(const struct gfx_firmware_header_v1_0 *)adev->gfx.pfp_fw->data;
			
 
				+			fw_data = (const __le32 *)
			
 
				+				(adev->gfx.pfp_fw->data +
			
 
				+				 le32_to_cpu(hdr->header.ucode_array_offset_bytes));
			
 
				+			table_offset = le32_to_cpu(hdr->jt_offset);
			
 
				+			table_size = le32_to_cpu(hdr->jt_size);
			
 
				+		} else if (me == 2) {
			
 
				+			const struct gfx_firmware_header_v1_0 *hdr =
			
 
				+				(const struct gfx_firmware_header_v1_0 *)adev->gfx.me_fw->data;
			
 
				+			fw_data = (const __le32 *)
			
 
				+				(adev->gfx.me_fw->data +
			
 
				+				 le32_to_cpu(hdr->header.ucode_array_offset_bytes));
			
 
				+			table_offset = le32_to_cpu(hdr->jt_offset);
			
 
				+			table_size = le32_to_cpu(hdr->jt_size);
			
 
				+		} else if (me == 3) {
			
 
				+			const struct gfx_firmware_header_v1_0 *hdr =
			
 
				+				(const struct gfx_firmware_header_v1_0 *)adev->gfx.mec_fw->data;
			
 
				+			fw_data = (const __le32 *)
			
 
				+				(adev->gfx.mec_fw->data +
			
 
				+				 le32_to_cpu(hdr->header.ucode_array_offset_bytes));
			
 
				+			table_offset = le32_to_cpu(hdr->jt_offset);
			
 
				+			table_size = le32_to_cpu(hdr->jt_size);
			
 
				+		} else  if (me == 4) {
			
 
				+			const struct gfx_firmware_header_v1_0 *hdr =
			
 
				+				(const struct gfx_firmware_header_v1_0 *)adev->gfx.mec2_fw->data;
			
 
				+			fw_data = (const __le32 *)
			
 
				+				(adev->gfx.mec2_fw->data +
			
 
				+				 le32_to_cpu(hdr->header.ucode_array_offset_bytes));
			
 
				+			table_offset = le32_to_cpu(hdr->jt_offset);
			
 
				+			table_size = le32_to_cpu(hdr->jt_size);
			
 
				+		}
			
 
				+
			
 
				+		for (i = 0; i < table_size; i ++) {
			
 
				+			dst_ptr[bo_offset + i] =
			
 
				+				cpu_to_le32(le32_to_cpu(fw_data[table_offset + i]));
			
 
				+		}
			
 
				+
			
 
				+		bo_offset += table_size;
			
 
				+	}
			
 
				+}
			
 
				+
			
 
				 static void gfx_v8_0_rlc_fini(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	int r;
			
@@ -1165,6 +1230,18 @@ static void gfx_v8_0_rlc_fini(struct amdgpu_device *adev)
 
				 		amdgpu_bo_unref(&adev->gfx.rlc.clear_state_obj);
			
 
				 		adev->gfx.rlc.clear_state_obj = NULL;
			
 
				 	}
			
 
				+
			
 
				+	/* jump table block */
			
 
				+	if (adev->gfx.rlc.cp_table_obj) {
			
 
				+		r = amdgpu_bo_reserve(adev->gfx.rlc.cp_table_obj, false);
			
 
				+		if (unlikely(r != 0))
			
 
				+			dev_warn(adev->dev, "(%d) reserve RLC cp table bo failed\n", r);
			
 
				+		amdgpu_bo_unpin(adev->gfx.rlc.cp_table_obj);
			
 
				+		amdgpu_bo_unreserve(adev->gfx.rlc.cp_table_obj);
			
 
				+
			
 
				+		amdgpu_bo_unref(&adev->gfx.rlc.cp_table_obj);
			
 
				+		adev->gfx.rlc.cp_table_obj = NULL;
			
 
				+	}
			
 
				 }
			
 
				 
			
 
				 static int gfx_v8_0_rlc_init(struct amdgpu_device *adev)
			
@@ -1221,6 +1298,46 @@ static int gfx_v8_0_rlc_init(struct amdgpu_device *adev)
 
				 		amdgpu_bo_unreserve(adev->gfx.rlc.clear_state_obj);
			
 
				 	}
			
 
				 
			
 
				+	if ((adev->asic_type == CHIP_CARRIZO) ||
			
 
				+	    (adev->asic_type == CHIP_STONEY)) {
			
 
				+		adev->gfx.rlc.cp_table_size = ALIGN(96 * 5 * 4, 2048) + (64 * 1024); /* JT + GDS */
			
 
				+		if (adev->gfx.rlc.cp_table_obj == NULL) {
			
 
				+			r = amdgpu_bo_create(adev, adev->gfx.rlc.cp_table_size, PAGE_SIZE, true,
			
 
				+					     AMDGPU_GEM_DOMAIN_VRAM,
			
 
				+					     AMDGPU_GEM_CREATE_CPU_ACCESS_REQUIRED,
			
 
				+					     NULL, NULL,
			
 
				+					     &adev->gfx.rlc.cp_table_obj);
			
 
				+			if (r) {
			
 
				+				dev_warn(adev->dev, "(%d) create RLC cp table bo failed\n", r);
			
 
				+				return r;
			
 
				+			}
			
 
				+		}
			
 
				+
			
 
				+		r = amdgpu_bo_reserve(adev->gfx.rlc.cp_table_obj, false);
			
 
				+		if (unlikely(r != 0)) {
			
 
				+			dev_warn(adev->dev, "(%d) reserve RLC cp table bo failed\n", r);
			
 
				+			return r;
			
 
				+		}
			
 
				+		r = amdgpu_bo_pin(adev->gfx.rlc.cp_table_obj, AMDGPU_GEM_DOMAIN_VRAM,
			
 
				+				  &adev->gfx.rlc.cp_table_gpu_addr);
			
 
				+		if (r) {
			
 
				+			amdgpu_bo_unreserve(adev->gfx.rlc.cp_table_obj);
			
 
				+			dev_warn(adev->dev, "(%d) pin RLC cp_table bo failed\n", r);
			
 
				+			return r;
			
 
				+		}
			
 
				+		r = amdgpu_bo_kmap(adev->gfx.rlc.cp_table_obj, (void **)&adev->gfx.rlc.cp_table_ptr);
			
 
				+		if (r) {
			
 
				+			dev_warn(adev->dev, "(%d) map RLC cp table bo failed\n", r);
			
 
				+			return r;
			
 
				+		}
			
 
				+
			
 
				+		cz_init_cp_jump_table(adev);
			
 
				+
			
 
				+		amdgpu_bo_kunmap(adev->gfx.rlc.cp_table_obj);
			
 
				+		amdgpu_bo_unreserve(adev->gfx.rlc.cp_table_obj);
			
 
				+
			
 
				+	}
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -3329,9 +3446,15 @@ static void gfx_v8_0_tiling_mode_table_init(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				-void gfx_v8_0_select_se_sh(struct amdgpu_device *adev, u32 se_num, u32 sh_num)
			
 
				+static void gfx_v8_0_select_se_sh(struct amdgpu_device *adev,
			
 
				+				  u32 se_num, u32 sh_num, u32 instance)
			
 
				 {
			
 
				-	u32 data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_BROADCAST_WRITES, 1);
			
 
				+	u32 data;
			
 
				+
			
 
				+	if (instance == 0xffffffff)
			
 
				+		data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_BROADCAST_WRITES, 1);
			
 
				+	else
			
 
				+		data = REG_SET_FIELD(0, GRBM_GFX_INDEX, INSTANCE_INDEX, instance);
			
 
				 
			
 
				 	if ((se_num == 0xffffffff) && (sh_num == 0xffffffff)) {
			
 
				 		data = REG_SET_FIELD(data, GRBM_GFX_INDEX, SH_BROADCAST_WRITES, 1);
			
@@ -3381,13 +3504,13 @@ static void gfx_v8_0_setup_rb(struct amdgpu_device *adev)
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				-			gfx_v8_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v8_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				 			data = gfx_v8_0_get_rb_active_bitmap(adev);
			
 
				 			active_rbs |= data << ((i * adev->gfx.config.max_sh_per_se + j) *
			
 
				 					       rb_bitmap_width_per_sh);
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	adev->gfx.config.backend_enable_mask = active_rbs;
			
@@ -3491,7 +3614,7 @@ static void gfx_v8_0_gpu_init(struct amdgpu_device *adev)
 
				 	 * making sure that the following register writes will be broadcasted
			
 
				 	 * to all the shaders
			
 
				 	 */
			
 
				-	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 
			
 
				 	WREG32(mmPA_SC_FIFO_SIZE,
			
 
				 		   (adev->gfx.config.sc_prim_fifo_size_frontend <<
			
@@ -3514,7 +3637,7 @@ static void gfx_v8_0_wait_for_rlc_serdes(struct amdgpu_device *adev)
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				-			gfx_v8_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v8_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				 			for (k = 0; k < adev->usec_timeout; k++) {
			
 
				 				if (RREG32(mmRLC_SERDES_CU_MASTER_BUSY) == 0)
			
 
				 					break;
			
@@ -3522,7 +3645,7 @@ static void gfx_v8_0_wait_for_rlc_serdes(struct amdgpu_device *adev)
 
				 			}
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	mask = RLC_SERDES_NONCU_MASTER_BUSY__SE_MASTER_BUSY_MASK |
			
@@ -3683,13 +3806,13 @@ static void gfx_v8_0_enable_save_restore_machine(struct amdgpu_device *adev)
 
				 	WREG32(mmRLC_SRM_CNTL, data);
			
 
				 }
			
 
				 
			
 
				-static void polaris11_init_power_gating(struct amdgpu_device *adev)
			
 
				+static void gfx_v8_0_init_power_gating(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	uint32_t data;
			
 
				 
			
 
				 	if (adev->pg_flags & (AMD_PG_SUPPORT_GFX_PG |
			
 
				-			AMD_PG_SUPPORT_GFX_SMG |
			
 
				-			AMD_PG_SUPPORT_GFX_DMG)) {
			
 
				+			      AMD_PG_SUPPORT_GFX_SMG |
			
 
				+			      AMD_PG_SUPPORT_GFX_DMG)) {
			
 
				 		data = RREG32(mmCP_RB_WPTR_POLL_CNTL);
			
 
				 		data &= ~CP_RB_WPTR_POLL_CNTL__IDLE_POLL_COUNT_MASK;
			
 
				 		data |= (0x60 << CP_RB_WPTR_POLL_CNTL__IDLE_POLL_COUNT__SHIFT);
			
@@ -3714,6 +3837,53 @@ static void polaris11_init_power_gating(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				+static void cz_enable_sck_slow_down_on_power_up(struct amdgpu_device *adev,
			
 
				+						bool enable)
			
 
				+{
			
 
				+	u32 data, orig;
			
 
				+
			
 
				+	orig = data = RREG32(mmRLC_PG_CNTL);
			
 
				+
			
 
				+	if (enable)
			
 
				+		data |= RLC_PG_CNTL__SMU_CLK_SLOWDOWN_ON_PU_ENABLE_MASK;
			
 
				+	else
			
 
				+		data &= ~RLC_PG_CNTL__SMU_CLK_SLOWDOWN_ON_PU_ENABLE_MASK;
			
 
				+
			
 
				+	if (orig != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+}
			
 
				+
			
 
				+static void cz_enable_sck_slow_down_on_power_down(struct amdgpu_device *adev,
			
 
				+						  bool enable)
			
 
				+{
			
 
				+	u32 data, orig;
			
 
				+
			
 
				+	orig = data = RREG32(mmRLC_PG_CNTL);
			
 
				+
			
 
				+	if (enable)
			
 
				+		data |= RLC_PG_CNTL__SMU_CLK_SLOWDOWN_ON_PD_ENABLE_MASK;
			
 
				+	else
			
 
				+		data &= ~RLC_PG_CNTL__SMU_CLK_SLOWDOWN_ON_PD_ENABLE_MASK;
			
 
				+
			
 
				+	if (orig != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+}
			
 
				+
			
 
				+static void cz_enable_cp_power_gating(struct amdgpu_device *adev, bool enable)
			
 
				+{
			
 
				+	u32 data, orig;
			
 
				+
			
 
				+	orig = data = RREG32(mmRLC_PG_CNTL);
			
 
				+
			
 
				+	if (enable)
			
 
				+		data &= ~RLC_PG_CNTL__CP_PG_DISABLE_MASK;
			
 
				+	else
			
 
				+		data |= RLC_PG_CNTL__CP_PG_DISABLE_MASK;
			
 
				+
			
 
				+	if (orig != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+}
			
 
				+
			
 
				 static void gfx_v8_0_init_pg(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	if (adev->pg_flags & (AMD_PG_SUPPORT_GFX_PG |
			
@@ -3726,8 +3896,25 @@ static void gfx_v8_0_init_pg(struct amdgpu_device *adev)
 
				 		gfx_v8_0_init_save_restore_list(adev);
			
 
				 		gfx_v8_0_enable_save_restore_machine(adev);
			
 
				 
			
 
				-		if (adev->asic_type == CHIP_POLARIS11)
			
 
				-			polaris11_init_power_gating(adev);
			
 
				+		if ((adev->asic_type == CHIP_CARRIZO) ||
			
 
				+		    (adev->asic_type == CHIP_STONEY)) {
			
 
				+			WREG32(mmRLC_JUMP_TABLE_RESTORE, adev->gfx.rlc.cp_table_gpu_addr >> 8);
			
 
				+			gfx_v8_0_init_power_gating(adev);
			
 
				+			WREG32(mmRLC_PG_ALWAYS_ON_CU_MASK, adev->gfx.cu_info.ao_cu_mask);
			
 
				+			if (adev->pg_flags & AMD_PG_SUPPORT_RLC_SMU_HS) {
			
 
				+				cz_enable_sck_slow_down_on_power_up(adev, true);
			
 
				+				cz_enable_sck_slow_down_on_power_down(adev, true);
			
 
				+			} else {
			
 
				+				cz_enable_sck_slow_down_on_power_up(adev, false);
			
 
				+				cz_enable_sck_slow_down_on_power_down(adev, false);
			
 
				+			}
			
 
				+			if (adev->pg_flags & AMD_PG_SUPPORT_CP)
			
 
				+				cz_enable_cp_power_gating(adev, true);
			
 
				+			else
			
 
				+				cz_enable_cp_power_gating(adev, false);
			
 
				+		} else if (adev->asic_type == CHIP_POLARIS11) {
			
 
				+			gfx_v8_0_init_power_gating(adev);
			
 
				+		}
			
 
				 	}
			
 
				 }
			
 
				 
			
@@ -4966,7 +5153,7 @@ static int gfx_v8_0_soft_reset(void *handle)
 
				  * Fetches a GPU clock counter snapshot.
			
 
				  * Returns the 64 bit clock counter snapshot.
			
 
				  */
			
 
				-uint64_t gfx_v8_0_get_gpu_clock_counter(struct amdgpu_device *adev)
			
 
				+static uint64_t gfx_v8_0_get_gpu_clock_counter(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	uint64_t clock;
			
 
				 
			
@@ -5026,12 +5213,18 @@ static void gfx_v8_0_ring_emit_gds_switch(struct amdgpu_ring *ring,
 
				 	amdgpu_ring_write(ring, (1 << (oa_size + oa_base)) - (1 << oa_base));
			
 
				 }
			
 
				 
			
 
				+static const struct amdgpu_gfx_funcs gfx_v8_0_gfx_funcs = {
			
 
				+	.get_gpu_clock_counter = &gfx_v8_0_get_gpu_clock_counter,
			
 
				+	.select_se_sh = &gfx_v8_0_select_se_sh,
			
 
				+};
			
 
				+
			
 
				 static int gfx_v8_0_early_init(void *handle)
			
 
				 {
			
 
				 	struct amdgpu_device *adev = (struct amdgpu_device *)handle;
			
 
				 
			
 
				 	adev->gfx.num_gfx_rings = GFX8_NUM_GFX_RINGS;
			
 
				 	adev->gfx.num_compute_rings = GFX8_NUM_COMPUTE_RINGS;
			
 
				+	adev->gfx.funcs = &gfx_v8_0_gfx_funcs;
			
 
				 	gfx_v8_0_set_ring_funcs(adev);
			
 
				 	gfx_v8_0_set_irq_funcs(adev);
			
 
				 	gfx_v8_0_set_gds_init(adev);
			
@@ -5064,51 +5257,43 @@ static int gfx_v8_0_late_init(void *handle)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				-static void polaris11_enable_gfx_static_mg_power_gating(struct amdgpu_device *adev,
			
 
				-		bool enable)
			
 
				+static void gfx_v8_0_enable_gfx_static_mg_power_gating(struct amdgpu_device *adev,
			
 
				+						       bool enable)
			
 
				 {
			
 
				 	uint32_t data, temp;
			
 
				 
			
 
				-	/* Send msg to SMU via Powerplay */
			
 
				-	amdgpu_set_powergating_state(adev,
			
 
				-			AMD_IP_BLOCK_TYPE_SMC,
			
 
				-			enable ? AMD_PG_STATE_GATE : AMD_PG_STATE_UNGATE);
			
 
				+	if (adev->asic_type == CHIP_POLARIS11)
			
 
				+		/* Send msg to SMU via Powerplay */
			
 
				+		amdgpu_set_powergating_state(adev,
			
 
				+					     AMD_IP_BLOCK_TYPE_SMC,
			
 
				+					     enable ?
			
 
				+					     AMD_PG_STATE_GATE : AMD_PG_STATE_UNGATE);
			
 
				 
			
 
				-	if (enable) {
			
 
				-		/* Enable static MGPG */
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	/* Enable static MGPG */
			
 
				+	if (enable)
			
 
				 		data |= RLC_PG_CNTL__STATIC_PER_CU_PG_ENABLE_MASK;
			
 
				-
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				-	} else {
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	else
			
 
				 		data &= ~RLC_PG_CNTL__STATIC_PER_CU_PG_ENABLE_MASK;
			
 
				 
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				-	}
			
 
				+	if (temp != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				 }
			
 
				 
			
 
				-static void polaris11_enable_gfx_dynamic_mg_power_gating(struct amdgpu_device *adev,
			
 
				-		bool enable)
			
 
				+static void gfx_v8_0_enable_gfx_dynamic_mg_power_gating(struct amdgpu_device *adev,
			
 
				+							bool enable)
			
 
				 {
			
 
				 	uint32_t data, temp;
			
 
				 
			
 
				-	if (enable) {
			
 
				-		/* Enable dynamic MGPG */
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	/* Enable dynamic MGPG */
			
 
				+	if (enable)
			
 
				 		data |= RLC_PG_CNTL__DYN_PER_CU_PG_ENABLE_MASK;
			
 
				-
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				-	} else {
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	else
			
 
				 		data &= ~RLC_PG_CNTL__DYN_PER_CU_PG_ENABLE_MASK;
			
 
				 
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				-	}
			
 
				+	if (temp != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				 }
			
 
				 
			
 
				 static void polaris11_enable_gfx_quick_mg_power_gating(struct amdgpu_device *adev,
			
@@ -5116,19 +5301,63 @@ static void polaris11_enable_gfx_quick_mg_power_gating(struct amdgpu_device *ade
 
				 {
			
 
				 	uint32_t data, temp;
			
 
				 
			
 
				-	if (enable) {
			
 
				-		/* Enable quick PG */
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				-		data |= 0x100000;
			
 
				+	temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				+	/* Enable quick PG */
			
 
				+	if (enable)
			
 
				+		data |= RLC_PG_CNTL__QUICK_PG_ENABLE_MASK;
			
 
				+	else
			
 
				+		data &= ~RLC_PG_CNTL__QUICK_PG_ENABLE_MASK;
			
 
				 
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				-	} else {
			
 
				-		temp = data = RREG32(mmRLC_PG_CNTL);
			
 
				-		data &= ~0x100000;
			
 
				+	if (temp != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+}
			
 
				 
			
 
				-		if (temp != data)
			
 
				-			WREG32(mmRLC_PG_CNTL, data);
			
 
				+static void cz_enable_gfx_cg_power_gating(struct amdgpu_device *adev,
			
 
				+					  bool enable)
			
 
				+{
			
 
				+	u32 data, orig;
			
 
				+
			
 
				+	orig = data = RREG32(mmRLC_PG_CNTL);
			
 
				+
			
 
				+	if (enable)
			
 
				+		data |= RLC_PG_CNTL__GFX_POWER_GATING_ENABLE_MASK;
			
 
				+	else
			
 
				+		data &= ~RLC_PG_CNTL__GFX_POWER_GATING_ENABLE_MASK;
			
 
				+
			
 
				+	if (orig != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+}
			
 
				+
			
 
				+static void cz_enable_gfx_pipeline_power_gating(struct amdgpu_device *adev,
			
 
				+						bool enable)
			
 
				+{
			
 
				+	u32 data, orig;
			
 
				+
			
 
				+	orig = data = RREG32(mmRLC_PG_CNTL);
			
 
				+
			
 
				+	if (enable)
			
 
				+		data |= RLC_PG_CNTL__GFX_PIPELINE_PG_ENABLE_MASK;
			
 
				+	else
			
 
				+		data &= ~RLC_PG_CNTL__GFX_PIPELINE_PG_ENABLE_MASK;
			
 
				+
			
 
				+	if (orig != data)
			
 
				+		WREG32(mmRLC_PG_CNTL, data);
			
 
				+
			
 
				+	/* Read any GFX register to wake up GFX. */
			
 
				+	if (!enable)
			
 
				+		data = RREG32(mmDB_RENDER_CONTROL);
			
 
				+}
			
 
				+
			
 
				+static void cz_update_gfx_cg_power_gating(struct amdgpu_device *adev,
			
 
				+					  bool enable)
			
 
				+{
			
 
				+	if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_PG) && enable) {
			
 
				+		cz_enable_gfx_cg_power_gating(adev, true);
			
 
				+		if (adev->pg_flags & AMD_PG_SUPPORT_GFX_PIPELINE)
			
 
				+			cz_enable_gfx_pipeline_power_gating(adev, true);
			
 
				+	} else {
			
 
				+		cz_enable_gfx_cg_power_gating(adev, false);
			
 
				+		cz_enable_gfx_pipeline_power_gating(adev, false);
			
 
				 	}
			
 
				 }
			
 
				 
			
@@ -5136,21 +5365,42 @@ static int gfx_v8_0_set_powergating_state(void *handle,
 
				 					  enum amd_powergating_state state)
			
 
				 {
			
 
				 	struct amdgpu_device *adev = (struct amdgpu_device *)handle;
			
 
				+	bool enable = (state == AMD_PG_STATE_GATE) ? true : false;
			
 
				 
			
 
				 	if (!(adev->pg_flags & AMD_PG_SUPPORT_GFX_PG))
			
 
				 		return 0;
			
 
				 
			
 
				 	switch (adev->asic_type) {
			
 
				+	case CHIP_CARRIZO:
			
 
				+	case CHIP_STONEY:
			
 
				+		if (adev->pg_flags & AMD_PG_SUPPORT_GFX_PG)
			
 
				+			cz_update_gfx_cg_power_gating(adev, enable);
			
 
				+
			
 
				+		if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_SMG) && enable)
			
 
				+			gfx_v8_0_enable_gfx_static_mg_power_gating(adev, true);
			
 
				+		else
			
 
				+			gfx_v8_0_enable_gfx_static_mg_power_gating(adev, false);
			
 
				+
			
 
				+		if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_DMG) && enable)
			
 
				+			gfx_v8_0_enable_gfx_dynamic_mg_power_gating(adev, true);
			
 
				+		else
			
 
				+			gfx_v8_0_enable_gfx_dynamic_mg_power_gating(adev, false);
			
 
				+		break;
			
 
				 	case CHIP_POLARIS11:
			
 
				-		if (adev->pg_flags & AMD_PG_SUPPORT_GFX_SMG)
			
 
				-			polaris11_enable_gfx_static_mg_power_gating(adev,
			
 
				-					state == AMD_PG_STATE_GATE ? true : false);
			
 
				-		else if (adev->pg_flags & AMD_PG_SUPPORT_GFX_DMG)
			
 
				-			polaris11_enable_gfx_dynamic_mg_power_gating(adev,
			
 
				-					state == AMD_PG_STATE_GATE ? true : false);
			
 
				+		if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_SMG) && enable)
			
 
				+			gfx_v8_0_enable_gfx_static_mg_power_gating(adev, true);
			
 
				+		else
			
 
				+			gfx_v8_0_enable_gfx_static_mg_power_gating(adev, false);
			
 
				+
			
 
				+		if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_DMG) && enable)
			
 
				+			gfx_v8_0_enable_gfx_dynamic_mg_power_gating(adev, true);
			
 
				 		else
			
 
				-			polaris11_enable_gfx_quick_mg_power_gating(adev,
			
 
				-					state == AMD_PG_STATE_GATE ? true : false);
			
 
				+			gfx_v8_0_enable_gfx_dynamic_mg_power_gating(adev, false);
			
 
				+
			
 
				+		if ((adev->pg_flags & AMD_PG_SUPPORT_GFX_QUICK_MG) && enable)
			
 
				+			polaris11_enable_gfx_quick_mg_power_gating(adev, true);
			
 
				+		else
			
 
				+			polaris11_enable_gfx_quick_mg_power_gating(adev, false);
			
 
				 		break;
			
 
				 	default:
			
 
				 		break;
			
@@ -5164,7 +5414,7 @@ static void gfx_v8_0_send_serdes_cmd(struct amdgpu_device *adev,
 
				 {
			
 
				 	uint32_t data;
			
 
				 
			
 
				-	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 
			
 
				 	WREG32(mmRLC_SERDES_WR_CU_MASTER_MASK, 0xffffffff);
			
 
				 	WREG32(mmRLC_SERDES_WR_NONCU_MASTER_MASK, 0xffffffff);
			
@@ -5552,6 +5802,8 @@ static void gfx_v8_0_update_coarse_grain_clock_gating(struct amdgpu_device *adev
 
				 			WREG32(mmRLC_CGCG_CGLS_CTRL, data);
			
 
				 	}
			
 
				 
			
 
				+	gfx_v8_0_wait_for_rlc_serdes(adev);
			
 
				+
			
 
				 	adev->gfx.rlc.funcs->exit_safe_mode(adev);
			
 
				 }
			
 
				 static int gfx_v8_0_update_gfx_clock_gating(struct amdgpu_device *adev,
			
@@ -5677,17 +5929,6 @@ static void gfx_v8_0_ring_emit_ib_gfx(struct amdgpu_ring *ring,
 
				 				      unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				 	u32 header, control = 0;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	if (ctx_switch)
			
 
				-		next_rptr += 2;
			
 
				-
			
 
				-	next_rptr += 4;
			
 
				-	amdgpu_ring_write(ring, PACKET3(PACKET3_WRITE_DATA, 3));
			
 
				-	amdgpu_ring_write(ring, WRITE_DATA_DST_SEL(5) | WR_CONFIRM);
			
 
				-	amdgpu_ring_write(ring, ring->next_rptr_gpu_addr & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr) & 0xffffffff);
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				 
			
 
				 	/* insert SWITCH_BUFFER packet before first IB in the ring frame */
			
 
				 	if (ctx_switch) {
			
@@ -5716,23 +5957,9 @@ static void gfx_v8_0_ring_emit_ib_compute(struct amdgpu_ring *ring,
 
				 					  struct amdgpu_ib *ib,
			
 
				 					  unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				-	u32 header, control = 0;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	control |= INDIRECT_BUFFER_VALID;
			
 
				+	u32 control = INDIRECT_BUFFER_VALID | ib->length_dw | (vm_id << 24);
			
 
				 
			
 
				-	next_rptr += 4;
			
 
				-	amdgpu_ring_write(ring, PACKET3(PACKET3_WRITE_DATA, 3));
			
 
				-	amdgpu_ring_write(ring, WRITE_DATA_DST_SEL(5) | WR_CONFIRM);
			
 
				-	amdgpu_ring_write(ring, ring->next_rptr_gpu_addr & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr) & 0xffffffff);
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				-
			
 
				-	header = PACKET3(PACKET3_INDIRECT_BUFFER, 2);
			
 
				-
			
 
				-	control |= ib->length_dw | (vm_id << 24);
			
 
				-
			
 
				-	amdgpu_ring_write(ring, header);
			
 
				+	amdgpu_ring_write(ring, PACKET3(PACKET3_INDIRECT_BUFFER, 2));
			
 
				 	amdgpu_ring_write(ring,
			
 
				 #ifdef __BIG_ENDIAN
			
 
				 					  (2 << 0) |
			
@@ -6185,9 +6412,9 @@ static void gfx_v8_0_set_rlc_funcs(struct amdgpu_device *adev)
 
				 {
			
 
				 	switch (adev->asic_type) {
			
 
				 	case CHIP_TOPAZ:
			
 
				-	case CHIP_STONEY:
			
 
				 		adev->gfx.rlc.funcs = &iceland_rlc_funcs;
			
 
				 		break;
			
 
				+	case CHIP_STONEY:
			
 
				 	case CHIP_CARRIZO:
			
 
				 		adev->gfx.rlc.funcs = &cz_rlc_funcs;
			
 
				 		break;
			
@@ -6225,6 +6452,20 @@ static void gfx_v8_0_set_gds_init(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				+static void gfx_v8_0_set_user_cu_inactive_bitmap(struct amdgpu_device *adev,
			
 
				+						 u32 bitmap)
			
 
				+{
			
 
				+	u32 data;
			
 
				+
			
 
				+	if (!bitmap)
			
 
				+		return;
			
 
				+
			
 
				+	data = bitmap << GC_USER_SHADER_ARRAY_CONFIG__INACTIVE_CUS__SHIFT;
			
 
				+	data &= GC_USER_SHADER_ARRAY_CONFIG__INACTIVE_CUS_MASK;
			
 
				+
			
 
				+	WREG32(mmGC_USER_SHADER_ARRAY_CONFIG, data);
			
 
				+}
			
 
				+
			
 
				 static u32 gfx_v8_0_get_cu_active_bitmap(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 data, mask;
			
@@ -6245,16 +6486,22 @@ static void gfx_v8_0_get_cu_info(struct amdgpu_device *adev)
 
				 	int i, j, k, counter, active_cu_number = 0;
			
 
				 	u32 mask, bitmap, ao_bitmap, ao_cu_mask = 0;
			
 
				 	struct amdgpu_cu_info *cu_info = &adev->gfx.cu_info;
			
 
				+	unsigned disable_masks[4 * 2];
			
 
				 
			
 
				 	memset(cu_info, 0, sizeof(*cu_info));
			
 
				 
			
 
				+	amdgpu_gfx_parse_disable_cu(disable_masks, 4, 2);
			
 
				+
			
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	for (i = 0; i < adev->gfx.config.max_shader_engines; i++) {
			
 
				 		for (j = 0; j < adev->gfx.config.max_sh_per_se; j++) {
			
 
				 			mask = 1;
			
 
				 			ao_bitmap = 0;
			
 
				 			counter = 0;
			
 
				-			gfx_v8_0_select_se_sh(adev, i, j);
			
 
				+			gfx_v8_0_select_se_sh(adev, i, j, 0xffffffff);
			
 
				+			if (i < 4 && j < 2)
			
 
				+				gfx_v8_0_set_user_cu_inactive_bitmap(
			
 
				+					adev, disable_masks[i * 2 + j]);
			
 
				 			bitmap = gfx_v8_0_get_cu_active_bitmap(adev);
			
 
				 			cu_info->bitmap[i][j] = bitmap;
			
 
				 
			
@@ -6270,7 +6517,7 @@ static void gfx_v8_0_get_cu_info(struct amdgpu_device *adev)
 
				 			ao_cu_mask |= (ao_bitmap << (i * 16 + j * 8));
			
 
				 		}
			
 
				 	}
			
 
				-	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+	gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 
			
 
				 	cu_info->number = active_cu_number;
			
--- a/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.h
+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v8_0.h
@@ -26,7 +26,6 @@
 
				 
			
 
				 extern const struct amd_ip_funcs gfx_v8_0_ip_funcs;
			
 
				 
			
 
				-uint64_t gfx_v8_0_get_gpu_clock_counter(struct amdgpu_device *adev);
			
 
				 void gfx_v8_0_select_se_sh(struct amdgpu_device *adev, u32 se_num, u32 sh_num);
			
 
				 
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v7_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v7_0.c
@@ -39,6 +39,7 @@
 
				 
			
 
				 static void gmc_v7_0_set_gart_funcs(struct amdgpu_device *adev);
			
 
				 static void gmc_v7_0_set_irq_funcs(struct amdgpu_device *adev);
			
 
				+static int gmc_v7_0_wait_for_idle(void *handle);
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/bonaire_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/hawaii_mc.bin");
			
@@ -73,39 +74,15 @@ static void gmc_v7_0_init_golden_registers(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				-/**
			
 
				- * gmc7_mc_wait_for_idle - wait for MC idle callback.
			
 
				- *
			
 
				- * @adev: amdgpu_device pointer
			
 
				- *
			
 
				- * Wait for the MC (memory controller) to be idle.
			
 
				- * (evergreen+).
			
 
				- * Returns 0 if the MC is idle, -1 if not.
			
 
				- */
			
 
				-int gmc_v7_0_mc_wait_for_idle(struct amdgpu_device *adev)
			
 
				-{
			
 
				-	unsigned i;
			
 
				-	u32 tmp;
			
 
				-
			
 
				-	for (i = 0; i < adev->usec_timeout; i++) {
			
 
				-		/* read MC_STATUS */
			
 
				-		tmp = RREG32(mmSRBM_STATUS) & 0x1F00;
			
 
				-		if (!tmp)
			
 
				-			return 0;
			
 
				-		udelay(1);
			
 
				-	}
			
 
				-	return -1;
			
 
				-}
			
 
				-
			
 
				-void gmc_v7_0_mc_stop(struct amdgpu_device *adev,
			
 
				-		      struct amdgpu_mode_mc_save *save)
			
 
				+static void gmc_v7_0_mc_stop(struct amdgpu_device *adev,
			
 
				+			     struct amdgpu_mode_mc_save *save)
			
 
				 {
			
 
				 	u32 blackout;
			
 
				 
			
 
				 	if (adev->mode_info.num_crtc)
			
 
				 		amdgpu_display_stop_mc_access(adev, save);
			
 
				 
			
 
				-	amdgpu_asic_wait_for_mc_idle(adev);
			
 
				+	gmc_v7_0_wait_for_idle((void *)adev);
			
 
				 
			
 
				 	blackout = RREG32(mmMC_SHARED_BLACKOUT_CNTL);
			
 
				 	if (REG_GET_FIELD(blackout, MC_SHARED_BLACKOUT_CNTL, BLACKOUT_MODE) != 1) {
			
@@ -120,8 +97,8 @@ void gmc_v7_0_mc_stop(struct amdgpu_device *adev,
 
				 	udelay(100);
			
 
				 }
			
 
				 
			
 
				-void gmc_v7_0_mc_resume(struct amdgpu_device *adev,
			
 
				-			struct amdgpu_mode_mc_save *save)
			
 
				+static void gmc_v7_0_mc_resume(struct amdgpu_device *adev,
			
 
				+			       struct amdgpu_mode_mc_save *save)
			
 
				 {
			
 
				 	u32 tmp;
			
 
				 
			
@@ -311,7 +288,7 @@ static void gmc_v7_0_mc_program(struct amdgpu_device *adev)
 
				 		amdgpu_display_set_vga_render_state(adev, false);
			
 
				 
			
 
				 	gmc_v7_0_mc_stop(adev, &save);
			
 
				-	if (amdgpu_asic_wait_for_mc_idle(adev)) {
			
 
				+	if (gmc_v7_0_wait_for_idle((void *)adev)) {
			
 
				 		dev_warn(adev->dev, "Wait for MC idle timedout !\n");
			
 
				 	}
			
 
				 	/* Update configuration */
			
@@ -331,7 +308,7 @@ static void gmc_v7_0_mc_program(struct amdgpu_device *adev)
 
				 	WREG32(mmMC_VM_AGP_BASE, 0);
			
 
				 	WREG32(mmMC_VM_AGP_TOP, 0x0FFFFFFF);
			
 
				 	WREG32(mmMC_VM_AGP_BOT, 0x0FFFFFFF);
			
 
				-	if (amdgpu_asic_wait_for_mc_idle(adev)) {
			
 
				+	if (gmc_v7_0_wait_for_idle((void *)adev)) {
			
 
				 		dev_warn(adev->dev, "Wait for MC idle timedout !\n");
			
 
				 	}
			
 
				 	gmc_v7_0_mc_resume(adev, &save);
			
@@ -1137,7 +1114,7 @@ static int gmc_v7_0_soft_reset(void *handle)
 
				 
			
 
				 	if (srbm_soft_reset) {
			
 
				 		gmc_v7_0_mc_stop(adev, &save);
			
 
				-		if (gmc_v7_0_wait_for_idle(adev)) {
			
 
				+		if (gmc_v7_0_wait_for_idle((void *)adev)) {
			
 
				 			dev_warn(adev->dev, "Wait for GMC idle timed out !\n");
			
 
				 		}
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v7_0.h
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v7_0.h
@@ -26,11 +26,4 @@
 
				 
			
 
				 extern const struct amd_ip_funcs gmc_v7_0_ip_funcs;
			
 
				 
			
 
				-/* XXX these shouldn't be exported */
			
 
				-void gmc_v7_0_mc_stop(struct amdgpu_device *adev,
			
 
				-		      struct amdgpu_mode_mc_save *save);
			
 
				-void gmc_v7_0_mc_resume(struct amdgpu_device *adev,
			
 
				-			struct amdgpu_mode_mc_save *save);
			
 
				-int gmc_v7_0_mc_wait_for_idle(struct amdgpu_device *adev);
			
 
				-
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v8_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v8_0.c
@@ -41,6 +41,7 @@
 
				 
			
 
				 static void gmc_v8_0_set_gart_funcs(struct amdgpu_device *adev);
			
 
				 static void gmc_v8_0_set_irq_funcs(struct amdgpu_device *adev);
			
 
				+static int gmc_v8_0_wait_for_idle(void *handle);
			
 
				 
			
 
				 MODULE_FIRMWARE("amdgpu/tonga_mc.bin");
			
 
				 MODULE_FIRMWARE("amdgpu/polaris11_mc.bin");
			
@@ -147,44 +148,15 @@ static void gmc_v8_0_init_golden_registers(struct amdgpu_device *adev)
 
				 	}
			
 
				 }
			
 
				 
			
 
				-/**
			
 
				- * gmc8_mc_wait_for_idle - wait for MC idle callback.
			
 
				- *
			
 
				- * @adev: amdgpu_device pointer
			
 
				- *
			
 
				- * Wait for the MC (memory controller) to be idle.
			
 
				- * (evergreen+).
			
 
				- * Returns 0 if the MC is idle, -1 if not.
			
 
				- */
			
 
				-int gmc_v8_0_mc_wait_for_idle(struct amdgpu_device *adev)
			
 
				-{
			
 
				-	unsigned i;
			
 
				-	u32 tmp;
			
 
				-
			
 
				-	for (i = 0; i < adev->usec_timeout; i++) {
			
 
				-		/* read MC_STATUS */
			
 
				-		tmp = RREG32(mmSRBM_STATUS) & (SRBM_STATUS__VMC_BUSY_MASK |
			
 
				-					       SRBM_STATUS__MCB_BUSY_MASK |
			
 
				-					       SRBM_STATUS__MCB_NON_DISPLAY_BUSY_MASK |
			
 
				-					       SRBM_STATUS__MCC_BUSY_MASK |
			
 
				-					       SRBM_STATUS__MCD_BUSY_MASK |
			
 
				-					       SRBM_STATUS__VMC1_BUSY_MASK);
			
 
				-		if (!tmp)
			
 
				-			return 0;
			
 
				-		udelay(1);
			
 
				-	}
			
 
				-	return -1;
			
 
				-}
			
 
				-
			
 
				-void gmc_v8_0_mc_stop(struct amdgpu_device *adev,
			
 
				-		      struct amdgpu_mode_mc_save *save)
			
 
				+static void gmc_v8_0_mc_stop(struct amdgpu_device *adev,
			
 
				+			     struct amdgpu_mode_mc_save *save)
			
 
				 {
			
 
				 	u32 blackout;
			
 
				 
			
 
				 	if (adev->mode_info.num_crtc)
			
 
				 		amdgpu_display_stop_mc_access(adev, save);
			
 
				 
			
 
				-	amdgpu_asic_wait_for_mc_idle(adev);
			
 
				+	gmc_v8_0_wait_for_idle(adev);
			
 
				 
			
 
				 	blackout = RREG32(mmMC_SHARED_BLACKOUT_CNTL);
			
 
				 	if (REG_GET_FIELD(blackout, MC_SHARED_BLACKOUT_CNTL, BLACKOUT_MODE) != 1) {
			
@@ -199,8 +171,8 @@ void gmc_v8_0_mc_stop(struct amdgpu_device *adev,
 
				 	udelay(100);
			
 
				 }
			
 
				 
			
 
				-void gmc_v8_0_mc_resume(struct amdgpu_device *adev,
			
 
				-			struct amdgpu_mode_mc_save *save)
			
 
				+static void gmc_v8_0_mc_resume(struct amdgpu_device *adev,
			
 
				+			       struct amdgpu_mode_mc_save *save)
			
 
				 {
			
 
				 	u32 tmp;
			
 
				 
			
@@ -393,7 +365,7 @@ static void gmc_v8_0_mc_program(struct amdgpu_device *adev)
 
				 		amdgpu_display_set_vga_render_state(adev, false);
			
 
				 
			
 
				 	gmc_v8_0_mc_stop(adev, &save);
			
 
				-	if (amdgpu_asic_wait_for_mc_idle(adev)) {
			
 
				+	if (gmc_v8_0_wait_for_idle((void *)adev)) {
			
 
				 		dev_warn(adev->dev, "Wait for MC idle timedout !\n");
			
 
				 	}
			
 
				 	/* Update configuration */
			
@@ -413,7 +385,7 @@ static void gmc_v8_0_mc_program(struct amdgpu_device *adev)
 
				 	WREG32(mmMC_VM_AGP_BASE, 0);
			
 
				 	WREG32(mmMC_VM_AGP_TOP, 0x0FFFFFFF);
			
 
				 	WREG32(mmMC_VM_AGP_BOT, 0x0FFFFFFF);
			
 
				-	if (amdgpu_asic_wait_for_mc_idle(adev)) {
			
 
				+	if (gmc_v8_0_wait_for_idle((void *)adev)) {
			
 
				 		dev_warn(adev->dev, "Wait for MC idle timedout !\n");
			
 
				 	}
			
 
				 	gmc_v8_0_mc_resume(adev, &save);
			
@@ -1140,7 +1112,7 @@ static int gmc_v8_0_soft_reset(void *handle)
 
				 
			
 
				 	if (srbm_soft_reset) {
			
 
				 		gmc_v8_0_mc_stop(adev, &save);
			
 
				-		if (gmc_v8_0_wait_for_idle(adev)) {
			
 
				+		if (gmc_v8_0_wait_for_idle((void *)adev)) {
			
 
				 			dev_warn(adev->dev, "Wait for GMC idle timed out !\n");
			
 
				 		}
			
 
				 
			
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v8_0.h
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v8_0.h
@@ -26,11 +26,4 @@
 
				 
			
 
				 extern const struct amd_ip_funcs gmc_v8_0_ip_funcs;
			
 
				 
			
 
				-/* XXX these shouldn't be exported */
			
 
				-void gmc_v8_0_mc_stop(struct amdgpu_device *adev,
			
 
				-		      struct amdgpu_mode_mc_save *save);
			
 
				-void gmc_v8_0_mc_resume(struct amdgpu_device *adev,
			
 
				-			struct amdgpu_mode_mc_save *save);
			
 
				-int gmc_v8_0_mc_wait_for_idle(struct amdgpu_device *adev);
			
 
				-
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/amdgpu/kv_dpm.c
+++ b/drivers/gpu/drm/amd/amdgpu/kv_dpm.c
@@ -507,19 +507,19 @@ static int kv_enable_didt(struct amdgpu_device *adev, bool enable)
 
				 	    pi->caps_db_ramping ||
			
 
				 	    pi->caps_td_ramping ||
			
 
				 	    pi->caps_tcp_ramping) {
			
 
				-		gfx_v7_0_enter_rlc_safe_mode(adev);
			
 
				+		adev->gfx.rlc.funcs->enter_safe_mode(adev);
			
 
				 
			
 
				 		if (enable) {
			
 
				 			ret = kv_program_pt_config_registers(adev, didt_config_kv);
			
 
				 			if (ret) {
			
 
				-				gfx_v7_0_exit_rlc_safe_mode(adev);
			
 
				+				adev->gfx.rlc.funcs->exit_safe_mode(adev);
			
 
				 				return ret;
			
 
				 			}
			
 
				 		}
			
 
				 
			
 
				 		kv_do_enable_didt(adev, enable);
			
 
				 
			
 
				-		gfx_v7_0_exit_rlc_safe_mode(adev);
			
 
				+		adev->gfx.rlc.funcs->exit_safe_mode(adev);
			
 
				 	}
			
 
				 
			
 
				 	return 0;
			
--- a/drivers/gpu/drm/amd/amdgpu/sdma_v2_4.c
+++ b/drivers/gpu/drm/amd/amdgpu/sdma_v2_4.c
@@ -255,19 +255,6 @@ static void sdma_v2_4_ring_emit_ib(struct amdgpu_ring *ring,
 
				 				   unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				 	u32 vmid = vm_id & 0xf;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	while ((next_rptr & 7) != 2)
			
 
				-		next_rptr++;
			
 
				-
			
 
				-	next_rptr += 6;
			
 
				-
			
 
				-	amdgpu_ring_write(ring, SDMA_PKT_HEADER_OP(SDMA_OP_WRITE) |
			
 
				-			  SDMA_PKT_HEADER_SUB_OP(SDMA_SUBOP_WRITE_LINEAR));
			
 
				-	amdgpu_ring_write(ring, lower_32_bits(ring->next_rptr_gpu_addr) & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr));
			
 
				-	amdgpu_ring_write(ring, SDMA_PKT_WRITE_UNTILED_DW_3_COUNT(1));
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				 
			
 
				 	/* IB packet must end on a 8 DW boundary */
			
 
				 	sdma_v2_4_ring_insert_nop(ring, (10 - (ring->wptr & 7)) % 8);
			
--- a/drivers/gpu/drm/amd/amdgpu/sdma_v3_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/sdma_v3_0.c
@@ -415,18 +415,6 @@ static void sdma_v3_0_ring_emit_ib(struct amdgpu_ring *ring,
 
				 				   unsigned vm_id, bool ctx_switch)
			
 
				 {
			
 
				 	u32 vmid = vm_id & 0xf;
			
 
				-	u32 next_rptr = ring->wptr + 5;
			
 
				-
			
 
				-	while ((next_rptr & 7) != 2)
			
 
				-		next_rptr++;
			
 
				-	next_rptr += 6;
			
 
				-
			
 
				-	amdgpu_ring_write(ring, SDMA_PKT_HEADER_OP(SDMA_OP_WRITE) |
			
 
				-			  SDMA_PKT_HEADER_SUB_OP(SDMA_SUBOP_WRITE_LINEAR));
			
 
				-	amdgpu_ring_write(ring, lower_32_bits(ring->next_rptr_gpu_addr) & 0xfffffffc);
			
 
				-	amdgpu_ring_write(ring, upper_32_bits(ring->next_rptr_gpu_addr));
			
 
				-	amdgpu_ring_write(ring, SDMA_PKT_WRITE_UNTILED_DW_3_COUNT(1));
			
 
				-	amdgpu_ring_write(ring, next_rptr);
			
 
				 
			
 
				 	/* IB packet must end on a 8 DW boundary */
			
 
				 	sdma_v3_0_ring_insert_nop(ring, (10 - (ring->wptr & 7)) % 8);
			
--- a/drivers/gpu/drm/amd/amdgpu/uvd_v4_2.c
+++ b/drivers/gpu/drm/amd/amdgpu/uvd_v4_2.c
@@ -34,6 +34,8 @@
 
				 #include "oss/oss_2_0_d.h"
			
 
				 #include "oss/oss_2_0_sh_mask.h"
			
 
				 
			
 
				+#include "bif/bif_4_1_d.h"
			
 
				+
			
 
				 static void uvd_v4_2_mc_resume(struct amdgpu_device *adev);
			
 
				 static void uvd_v4_2_init_cg(struct amdgpu_device *adev);
			
 
				 static void uvd_v4_2_set_ring_funcs(struct amdgpu_device *adev);
			
@@ -438,6 +440,32 @@ static void uvd_v4_2_ring_emit_fence(struct amdgpu_ring *ring, u64 addr, u64 seq
 
				 	amdgpu_ring_write(ring, 2);
			
 
				 }
			
 
				 
			
 
				+/**
			
 
				+ * uvd_v4_2_ring_emit_hdp_flush - emit an hdp flush
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp flush.
			
 
				+ */
			
 
				+static void uvd_v4_2_ring_emit_hdp_flush(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_MEM_COHERENCY_FLUSH_CNTL, 0));
			
 
				+	amdgpu_ring_write(ring, 0);
			
 
				+}
			
 
				+
			
 
				+/**
			
 
				+ * uvd_v4_2_ring_hdp_invalidate - emit an hdp invalidate
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp invalidate.
			
 
				+ */
			
 
				+static void uvd_v4_2_ring_emit_hdp_invalidate(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_DEBUG0, 0));
			
 
				+	amdgpu_ring_write(ring, 1);
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * uvd_v4_2_ring_test_ring - register write test
			
 
				  *
			
@@ -763,6 +791,8 @@ static const struct amdgpu_ring_funcs uvd_v4_2_ring_funcs = {
 
				 	.parse_cs = amdgpu_uvd_ring_parse_cs,
			
 
				 	.emit_ib = uvd_v4_2_ring_emit_ib,
			
 
				 	.emit_fence = uvd_v4_2_ring_emit_fence,
			
 
				+	.emit_hdp_flush = uvd_v4_2_ring_emit_hdp_flush,
			
 
				+	.emit_hdp_invalidate = uvd_v4_2_ring_emit_hdp_invalidate,
			
 
				 	.test_ring = uvd_v4_2_ring_test_ring,
			
 
				 	.test_ib = uvd_v4_2_ring_test_ib,
			
 
				 	.insert_nop = amdgpu_ring_insert_nop,
			
--- a/drivers/gpu/drm/amd/amdgpu/uvd_v5_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/uvd_v5_0.c
@@ -31,6 +31,7 @@
 
				 #include "uvd/uvd_5_0_sh_mask.h"
			
 
				 #include "oss/oss_2_0_d.h"
			
 
				 #include "oss/oss_2_0_sh_mask.h"
			
 
				+#include "bif/bif_5_0_d.h"
			
 
				 #include "vi.h"
			
 
				 
			
 
				 static void uvd_v5_0_set_ring_funcs(struct amdgpu_device *adev);
			
@@ -488,6 +489,32 @@ static void uvd_v5_0_ring_emit_fence(struct amdgpu_ring *ring, u64 addr, u64 seq
 
				 	amdgpu_ring_write(ring, 2);
			
 
				 }
			
 
				 
			
 
				+/**
			
 
				+ * uvd_v5_0_ring_emit_hdp_flush - emit an hdp flush
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp flush.
			
 
				+ */
			
 
				+static void uvd_v5_0_ring_emit_hdp_flush(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_MEM_COHERENCY_FLUSH_CNTL, 0));
			
 
				+	amdgpu_ring_write(ring, 0);
			
 
				+}
			
 
				+
			
 
				+/**
			
 
				+ * uvd_v5_0_ring_hdp_invalidate - emit an hdp invalidate
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp invalidate.
			
 
				+ */
			
 
				+static void uvd_v5_0_ring_emit_hdp_invalidate(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_DEBUG0, 0));
			
 
				+	amdgpu_ring_write(ring, 1);
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * uvd_v5_0_ring_test_ring - register write test
			
 
				  *
			
@@ -815,6 +842,8 @@ static const struct amdgpu_ring_funcs uvd_v5_0_ring_funcs = {
 
				 	.parse_cs = amdgpu_uvd_ring_parse_cs,
			
 
				 	.emit_ib = uvd_v5_0_ring_emit_ib,
			
 
				 	.emit_fence = uvd_v5_0_ring_emit_fence,
			
 
				+	.emit_hdp_flush = uvd_v5_0_ring_emit_hdp_flush,
			
 
				+	.emit_hdp_invalidate = uvd_v5_0_ring_emit_hdp_invalidate,
			
 
				 	.test_ring = uvd_v5_0_ring_test_ring,
			
 
				 	.test_ib = uvd_v5_0_ring_test_ib,
			
 
				 	.insert_nop = amdgpu_ring_insert_nop,
			
--- a/drivers/gpu/drm/amd/amdgpu/uvd_v6_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/uvd_v6_0.c
@@ -33,6 +33,7 @@
 
				 #include "oss/oss_2_0_sh_mask.h"
			
 
				 #include "smu/smu_7_1_3_d.h"
			
 
				 #include "smu/smu_7_1_3_sh_mask.h"
			
 
				+#include "bif/bif_5_1_d.h"
			
 
				 #include "vi.h"
			
 
				 
			
 
				 static void uvd_v6_0_set_ring_funcs(struct amdgpu_device *adev);
			
@@ -385,8 +386,8 @@ static int uvd_v6_0_start(struct amdgpu_device *adev)
 
				 	uint32_t mp_swap_cntl;
			
 
				 	int i, j, r;
			
 
				 
			
 
				-	/*disable DPG */
			
 
				-	WREG32_P(mmUVD_POWER_STATUS, 0, ~(1 << 2));
			
 
				+	/* disable DPG */
			
 
				+	WREG32_P(mmUVD_POWER_STATUS, 0, ~UVD_POWER_STATUS__UVD_PG_MODE_MASK);
			
 
				 
			
 
				 	/* disable byte swapping */
			
 
				 	lmi_swap_cntl = 0;
			
@@ -405,17 +406,21 @@ static int uvd_v6_0_start(struct amdgpu_device *adev)
 
				 	}
			
 
				 
			
 
				 	/* disable interupt */
			
 
				-	WREG32_P(mmUVD_MASTINT_EN, 0, ~(1 << 1));
			
 
				+	WREG32_P(mmUVD_MASTINT_EN, 0, ~UVD_MASTINT_EN__VCPU_EN_MASK);
			
 
				 
			
 
				 	/* stall UMC and register bus before resetting VCPU */
			
 
				-	WREG32_P(mmUVD_LMI_CTRL2, 1 << 8, ~(1 << 8));
			
 
				+	WREG32_P(mmUVD_LMI_CTRL2, UVD_LMI_CTRL2__STALL_ARB_UMC_MASK, ~UVD_LMI_CTRL2__STALL_ARB_UMC_MASK);
			
 
				 	mdelay(1);
			
 
				 
			
 
				 	/* put LMI, VCPU, RBC etc... into reset */
			
 
				-	WREG32(mmUVD_SOFT_RESET, UVD_SOFT_RESET__LMI_SOFT_RESET_MASK |
			
 
				-		UVD_SOFT_RESET__VCPU_SOFT_RESET_MASK | UVD_SOFT_RESET__LBSI_SOFT_RESET_MASK |
			
 
				-		UVD_SOFT_RESET__RBC_SOFT_RESET_MASK | UVD_SOFT_RESET__CSM_SOFT_RESET_MASK |
			
 
				-		UVD_SOFT_RESET__CXW_SOFT_RESET_MASK | UVD_SOFT_RESET__TAP_SOFT_RESET_MASK |
			
 
				+	WREG32(mmUVD_SOFT_RESET,
			
 
				+		UVD_SOFT_RESET__LMI_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__VCPU_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__LBSI_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__RBC_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__CSM_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__CXW_SOFT_RESET_MASK |
			
 
				+		UVD_SOFT_RESET__TAP_SOFT_RESET_MASK |
			
 
				 		UVD_SOFT_RESET__LMI_UMC_SOFT_RESET_MASK);
			
 
				 	mdelay(5);
			
 
				 
			
@@ -424,8 +429,13 @@ static int uvd_v6_0_start(struct amdgpu_device *adev)
 
				 	mdelay(5);
			
 
				 
			
 
				 	/* initialize UVD memory controller */
			
 
				-	WREG32(mmUVD_LMI_CTRL, 0x40 | (1 << 8) | (1 << 13) |
			
 
				-			     (1 << 21) | (1 << 9) | (1 << 20));
			
 
				+	WREG32(mmUVD_LMI_CTRL,
			
 
				+		(0x40 << UVD_LMI_CTRL__WRITE_CLEAN_TIMER__SHIFT) |
			
 
				+		UVD_LMI_CTRL__WRITE_CLEAN_TIMER_EN_MASK |
			
 
				+		UVD_LMI_CTRL__DATA_COHERENCY_EN_MASK |
			
 
				+		UVD_LMI_CTRL__VCPU_DATA_COHERENCY_EN_MASK |
			
 
				+		UVD_LMI_CTRL__REQ_MODE_MASK |
			
 
				+		UVD_LMI_CTRL__DISABLE_ON_FWV_FAIL_MASK);
			
 
				 
			
 
				 #ifdef __BIG_ENDIAN
			
 
				 	/* swap (8 in 32) RB and IB */
			
@@ -447,10 +457,10 @@ static int uvd_v6_0_start(struct amdgpu_device *adev)
 
				 	mdelay(5);
			
 
				 
			
 
				 	/* enable VCPU clock */
			
 
				-	WREG32(mmUVD_VCPU_CNTL,  1 << 9);
			
 
				+	WREG32(mmUVD_VCPU_CNTL, UVD_VCPU_CNTL__CLK_EN_MASK);
			
 
				 
			
 
				 	/* enable UMC */
			
 
				-	WREG32_P(mmUVD_LMI_CTRL2, 0, ~(1 << 8));
			
 
				+	WREG32_P(mmUVD_LMI_CTRL2, 0, ~UVD_LMI_CTRL2__STALL_ARB_UMC_MASK);
			
 
				 
			
 
				 	/* boot up the VCPU */
			
 
				 	WREG32(mmUVD_SOFT_RESET, 0);
			
@@ -484,10 +494,12 @@ static int uvd_v6_0_start(struct amdgpu_device *adev)
 
				 		return r;
			
 
				 	}
			
 
				 	/* enable master interrupt */
			
 
				-	WREG32_P(mmUVD_MASTINT_EN, 3 << 1, ~(3 << 1));
			
 
				+	WREG32_P(mmUVD_MASTINT_EN,
			
 
				+		(UVD_MASTINT_EN__VCPU_EN_MASK|UVD_MASTINT_EN__SYS_EN_MASK),
			
 
				+		~(UVD_MASTINT_EN__VCPU_EN_MASK|UVD_MASTINT_EN__SYS_EN_MASK));
			
 
				 
			
 
				 	/* clear the bit 4 of UVD_STATUS */
			
 
				-	WREG32_P(mmUVD_STATUS, 0, ~(2 << 1));
			
 
				+	WREG32_P(mmUVD_STATUS, 0, ~(2 << UVD_STATUS__VCPU_REPORT__SHIFT));
			
 
				 
			
 
				 	rb_bufsz = order_base_2(ring->ring_size);
			
 
				 	tmp = 0;
			
@@ -580,6 +592,32 @@ static void uvd_v6_0_ring_emit_fence(struct amdgpu_ring *ring, u64 addr, u64 seq
 
				 	amdgpu_ring_write(ring, 2);
			
 
				 }
			
 
				 
			
 
				+/**
			
 
				+ * uvd_v6_0_ring_emit_hdp_flush - emit an hdp flush
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp flush.
			
 
				+ */
			
 
				+static void uvd_v6_0_ring_emit_hdp_flush(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_MEM_COHERENCY_FLUSH_CNTL, 0));
			
 
				+	amdgpu_ring_write(ring, 0);
			
 
				+}
			
 
				+
			
 
				+/**
			
 
				+ * uvd_v6_0_ring_hdp_invalidate - emit an hdp invalidate
			
 
				+ *
			
 
				+ * @ring: amdgpu_ring pointer
			
 
				+ *
			
 
				+ * Emits an hdp invalidate.
			
 
				+ */
			
 
				+static void uvd_v6_0_ring_emit_hdp_invalidate(struct amdgpu_ring *ring)
			
 
				+{
			
 
				+	amdgpu_ring_write(ring, PACKET0(mmHDP_DEBUG0, 0));
			
 
				+	amdgpu_ring_write(ring, 1);
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * uvd_v6_0_ring_test_ring - register write test
			
 
				  *
			
@@ -847,7 +885,8 @@ static int uvd_v6_0_set_clockgating_state(void *handle,
 
				 	bool enable = (state == AMD_CG_STATE_GATE) ? true : false;
			
 
				 	static int curstate = -1;
			
 
				 
			
 
				-	if (adev->asic_type == CHIP_FIJI)
			
 
				+	if (adev->asic_type == CHIP_FIJI ||
			
 
				+			adev->asic_type == CHIP_POLARIS10)
			
 
				 		uvd_v6_set_bypass_mode(adev, enable);
			
 
				 
			
 
				 	if (!(adev->cg_flags & AMD_CG_SUPPORT_UVD_MGCG))
			
@@ -919,6 +958,8 @@ static const struct amdgpu_ring_funcs uvd_v6_0_ring_funcs = {
 
				 	.parse_cs = amdgpu_uvd_ring_parse_cs,
			
 
				 	.emit_ib = uvd_v6_0_ring_emit_ib,
			
 
				 	.emit_fence = uvd_v6_0_ring_emit_fence,
			
 
				+	.emit_hdp_flush = uvd_v6_0_ring_emit_hdp_flush,
			
 
				+	.emit_hdp_invalidate = uvd_v6_0_ring_emit_hdp_invalidate,
			
 
				 	.test_ring = uvd_v6_0_ring_test_ring,
			
 
				 	.test_ib = uvd_v6_0_ring_test_ib,
			
 
				 	.insert_nop = amdgpu_ring_insert_nop,
			
--- a/drivers/gpu/drm/amd/amdgpu/vi.c
+++ b/drivers/gpu/drm/amd/amdgpu/vi.c
@@ -203,6 +203,29 @@ static void vi_didt_wreg(struct amdgpu_device *adev, u32 reg, u32 v)
 
				 	spin_unlock_irqrestore(&adev->didt_idx_lock, flags);
			
 
				 }
			
 
				 
			
 
				+static u32 vi_gc_cac_rreg(struct amdgpu_device *adev, u32 reg)
			
 
				+{
			
 
				+	unsigned long flags;
			
 
				+	u32 r;
			
 
				+
			
 
				+	spin_lock_irqsave(&adev->gc_cac_idx_lock, flags);
			
 
				+	WREG32(mmGC_CAC_IND_INDEX, (reg));
			
 
				+	r = RREG32(mmGC_CAC_IND_DATA);
			
 
				+	spin_unlock_irqrestore(&adev->gc_cac_idx_lock, flags);
			
 
				+	return r;
			
 
				+}
			
 
				+
			
 
				+static void vi_gc_cac_wreg(struct amdgpu_device *adev, u32 reg, u32 v)
			
 
				+{
			
 
				+	unsigned long flags;
			
 
				+
			
 
				+	spin_lock_irqsave(&adev->gc_cac_idx_lock, flags);
			
 
				+	WREG32(mmGC_CAC_IND_INDEX, (reg));
			
 
				+	WREG32(mmGC_CAC_IND_DATA, (v));
			
 
				+	spin_unlock_irqrestore(&adev->gc_cac_idx_lock, flags);
			
 
				+}
			
 
				+
			
 
				+
			
 
				 static const u32 tonga_mgcg_cgcg_init[] =
			
 
				 {
			
 
				 	mmCGTT_DRM_CLK_CTRL0, 0xffffffff, 0x00600100,
			
@@ -533,12 +556,12 @@ static uint32_t vi_read_indexed_register(struct amdgpu_device *adev, u32 se_num,
 
				 
			
 
				 	mutex_lock(&adev->grbm_idx_mutex);
			
 
				 	if (se_num != 0xffffffff || sh_num != 0xffffffff)
			
 
				-		gfx_v8_0_select_se_sh(adev, se_num, sh_num);
			
 
				+		amdgpu_gfx_select_se_sh(adev, se_num, sh_num, 0xffffffff);
			
 
				 
			
 
				 	val = RREG32(reg_offset);
			
 
				 
			
 
				 	if (se_num != 0xffffffff || sh_num != 0xffffffff)
			
 
				-		gfx_v8_0_select_se_sh(adev, 0xffffffff, 0xffffffff);
			
 
				+		amdgpu_gfx_select_se_sh(adev, 0xffffffff, 0xffffffff, 0xffffffff);
			
 
				 	mutex_unlock(&adev->grbm_idx_mutex);
			
 
				 	return val;
			
 
				 }
			
@@ -597,7 +620,7 @@ static int vi_read_register(struct amdgpu_device *adev, u32 se_num,
 
				 	return -EINVAL;
			
 
				 }
			
 
				 
			
 
				-static void vi_gpu_pci_config_reset(struct amdgpu_device *adev)
			
 
				+static int vi_gpu_pci_config_reset(struct amdgpu_device *adev)
			
 
				 {
			
 
				 	u32 i;
			
 
				 
			
@@ -612,11 +635,14 @@ static void vi_gpu_pci_config_reset(struct amdgpu_device *adev)
 
				 
			
 
				 	/* wait for asic to come out of reset */
			
 
				 	for (i = 0; i < adev->usec_timeout; i++) {
			
 
				-		if (RREG32(mmCONFIG_MEMSIZE) != 0xffffffff)
			
 
				-			break;
			
 
				+		if (RREG32(mmCONFIG_MEMSIZE) != 0xffffffff) {
			
 
				+			/* enable BM */
			
 
				+			pci_set_master(adev->pdev);
			
 
				+			return 0;
			
 
				+		}
			
 
				 		udelay(1);
			
 
				 	}
			
 
				-
			
 
				+	return -EINVAL;
			
 
				 }
			
 
				 
			
 
				 static void vi_set_bios_scratch_engine_hung(struct amdgpu_device *adev, bool hung)
			
@@ -642,13 +668,15 @@ static void vi_set_bios_scratch_engine_hung(struct amdgpu_device *adev, bool hun
 
				  */
			
 
				 static int vi_asic_reset(struct amdgpu_device *adev)
			
 
				 {
			
 
				+	int r;
			
 
				+
			
 
				 	vi_set_bios_scratch_engine_hung(adev, true);
			
 
				 
			
 
				-	vi_gpu_pci_config_reset(adev);
			
 
				+	r = vi_gpu_pci_config_reset(adev);
			
 
				 
			
 
				 	vi_set_bios_scratch_engine_hung(adev, false);
			
 
				 
			
 
				-	return 0;
			
 
				+	return r;
			
 
				 }
			
 
				 
			
 
				 static int vi_set_uvd_clock(struct amdgpu_device *adev, u32 clock,
			
@@ -1133,9 +1161,6 @@ static const struct amdgpu_asic_funcs vi_asic_funcs =
 
				 	.set_uvd_clocks = &vi_set_uvd_clocks,
			
 
				 	.set_vce_clocks = &vi_set_vce_clocks,
			
 
				 	.get_virtual_caps = &vi_get_virtual_caps,
			
 
				-	/* these should be moved to their own ip modules */
			
 
				-	.get_gpu_clock_counter = &gfx_v8_0_get_gpu_clock_counter,
			
 
				-	.wait_for_mc_idle = &gmc_v8_0_mc_wait_for_idle,
			
 
				 };
			
 
				 
			
 
				 static int vi_common_early_init(void *handle)
			
@@ -1156,6 +1181,8 @@ static int vi_common_early_init(void *handle)
 
				 	adev->uvd_ctx_wreg = &vi_uvd_ctx_wreg;
			
 
				 	adev->didt_rreg = &vi_didt_rreg;
			
 
				 	adev->didt_wreg = &vi_didt_wreg;
			
 
				+	adev->gc_cac_rreg = &vi_gc_cac_rreg;
			
 
				+	adev->gc_cac_wreg = &vi_gc_cac_wreg;
			
 
				 
			
 
				 	adev->asic_funcs = &vi_asic_funcs;
			
 
				 
			
@@ -1222,19 +1249,39 @@ static int vi_common_early_init(void *handle)
 
				 			AMD_CG_SUPPORT_HDP_LS |
			
 
				 			AMD_CG_SUPPORT_SDMA_MGCG |
			
 
				 			AMD_CG_SUPPORT_SDMA_LS;
			
 
				+		/* rev0 hardware doesn't support PG */
			
 
				 		adev->pg_flags = 0;
			
 
				+		if (adev->rev_id != 0x00)
			
 
				+			adev->pg_flags |= AMD_PG_SUPPORT_GFX_PG |
			
 
				+				AMD_PG_SUPPORT_GFX_SMG |
			
 
				+				AMD_PG_SUPPORT_GFX_DMG |
			
 
				+				AMD_PG_SUPPORT_CP |
			
 
				+				AMD_PG_SUPPORT_RLC_SMU_HS |
			
 
				+				AMD_PG_SUPPORT_GFX_PIPELINE;
			
 
				 		adev->external_rev_id = adev->rev_id + 0x1;
			
 
				 		break;
			
 
				 	case CHIP_STONEY:
			
 
				 		adev->cg_flags = AMD_CG_SUPPORT_UVD_MGCG |
			
 
				 			AMD_CG_SUPPORT_GFX_MGCG |
			
 
				 			AMD_CG_SUPPORT_GFX_MGLS |
			
 
				+			AMD_CG_SUPPORT_GFX_RLC_LS |
			
 
				+			AMD_CG_SUPPORT_GFX_CP_LS |
			
 
				+			AMD_CG_SUPPORT_GFX_CGTS |
			
 
				+			AMD_CG_SUPPORT_GFX_MGLS |
			
 
				+			AMD_CG_SUPPORT_GFX_CGTS_LS |
			
 
				+			AMD_CG_SUPPORT_GFX_CGCG |
			
 
				+			AMD_CG_SUPPORT_GFX_CGLS |
			
 
				 			AMD_CG_SUPPORT_BIF_LS |
			
 
				 			AMD_CG_SUPPORT_HDP_MGCG |
			
 
				 			AMD_CG_SUPPORT_HDP_LS |
			
 
				 			AMD_CG_SUPPORT_SDMA_MGCG |
			
 
				 			AMD_CG_SUPPORT_SDMA_LS;
			
 
				-		adev->pg_flags = 0;
			
 
				+		adev->pg_flags = AMD_PG_SUPPORT_GFX_PG |
			
 
				+			AMD_PG_SUPPORT_GFX_SMG |
			
 
				+			AMD_PG_SUPPORT_GFX_DMG |
			
 
				+			AMD_PG_SUPPORT_GFX_PIPELINE |
			
 
				+			AMD_PG_SUPPORT_CP |
			
 
				+			AMD_PG_SUPPORT_RLC_SMU_HS;
			
 
				 		adev->external_rev_id = adev->rev_id + 0x1;
			
 
				 		break;
			
 
				 	default:
			
--- a/drivers/gpu/drm/amd/include/amd_pcie.h
+++ b/drivers/gpu/drm/amd/include/amd_pcie.h
@@ -37,6 +37,13 @@
 
				 #define CAIL_ASIC_PCIE_LINK_SPEED_SUPPORT_MASK   0x0000FFFF
			
 
				 #define CAIL_ASIC_PCIE_LINK_SPEED_SUPPORT_SHIFT  0
			
 
				 
			
 
				+/* gen: chipset 1/2, asic 1/2/3 */
			
 
				+#define AMDGPU_DEFAULT_PCIE_GEN_MASK (CAIL_PCIE_LINK_SPEED_SUPPORT_GEN1 \
			
 
				+				      | CAIL_PCIE_LINK_SPEED_SUPPORT_GEN2 \
			
 
				+				      | CAIL_ASIC_PCIE_LINK_SPEED_SUPPORT_GEN1 \
			
 
				+				      | CAIL_ASIC_PCIE_LINK_SPEED_SUPPORT_GEN2 \
			
 
				+				      | CAIL_ASIC_PCIE_LINK_SPEED_SUPPORT_GEN3)
			
 
				+
			
 
				 /* Following flags shows PCIe lane width switch supported in driver which are decided by chipset and ASIC */
			
 
				 #define CAIL_PCIE_LINK_WIDTH_SUPPORT_X1          0x00010000
			
 
				 #define CAIL_PCIE_LINK_WIDTH_SUPPORT_X2          0x00020000
			
@@ -47,4 +54,11 @@
 
				 #define CAIL_PCIE_LINK_WIDTH_SUPPORT_X32         0x00400000
			
 
				 #define CAIL_PCIE_LINK_WIDTH_SUPPORT_SHIFT       16
			
 
				 
			
 
				+/* 1/2/4/8/16 lanes */
			
 
				+#define AMDGPU_DEFAULT_PCIE_MLW_MASK (CAIL_PCIE_LINK_WIDTH_SUPPORT_X1 \
			
 
				+				      | CAIL_PCIE_LINK_WIDTH_SUPPORT_X2 \
			
 
				+				      | CAIL_PCIE_LINK_WIDTH_SUPPORT_X4 \
			
 
				+				      | CAIL_PCIE_LINK_WIDTH_SUPPORT_X8 \
			
 
				+				      | CAIL_PCIE_LINK_WIDTH_SUPPORT_X16)
			
 
				+
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/include/amd_shared.h
+++ b/drivers/gpu/drm/amd/include/amd_shared.h
@@ -25,15 +25,6 @@
 
				 
			
 
				 #define AMD_MAX_USEC_TIMEOUT		100000  /* 100 ms */
			
 
				 
			
 
				-/*
			
 
				-* Supported GPU families (aligned with amdgpu_drm.h)
			
 
				-*/
			
 
				-#define AMD_FAMILY_UNKNOWN              0
			
 
				-#define AMD_FAMILY_CI                   120 /* Bonaire, Hawaii */
			
 
				-#define AMD_FAMILY_KV                   125 /* Kaveri, Kabini, Mullins */
			
 
				-#define AMD_FAMILY_VI                   130 /* Iceland, Tonga */
			
 
				-#define AMD_FAMILY_CZ                   135 /* Carrizo */
			
 
				-
			
 
				 /*
			
 
				  * Supported ASIC types
			
 
				  */
			
@@ -120,6 +111,8 @@ enum amd_powergating_state {
 
				 #define AMD_PG_SUPPORT_SDMA			(1 << 8)
			
 
				 #define AMD_PG_SUPPORT_ACP			(1 << 9)
			
 
				 #define AMD_PG_SUPPORT_SAMU			(1 << 10)
			
 
				+#define AMD_PG_SUPPORT_GFX_QUICK_MG		(1 << 11)
			
 
				+#define AMD_PG_SUPPORT_GFX_PIPELINE		(1 << 12)
			
 
				 
			
 
				 enum amd_pm_state_type {
			
 
				 	/* not used for dpm */
			
--- a/drivers/gpu/drm/amd/include/asic_reg/gca/gfx_8_0_d.h
+++ b/drivers/gpu/drm/amd/include/asic_reg/gca/gfx_8_0_d.h
@@ -2823,4 +2823,7 @@
 
				 #define mmDC_EDC_CSINVOC_CNT                                                    0x3192
			
 
				 #define mmDC_EDC_RESTORE_CNT                                                    0x3193
			
 
				 
			
 
				+#define mmGC_CAC_IND_INDEX                                                      0x129a
			
 
				+#define mmGC_CAC_IND_DATA                                                       0x129b
			
 
				+
			
 
				 #endif /* GFX_8_0_D_H */
			
--- a/drivers/gpu/drm/amd/include/asic_reg/gca/gfx_8_0_sh_mask.h
+++ b/drivers/gpu/drm/amd/include/asic_reg/gca/gfx_8_0_sh_mask.h
@@ -8730,8 +8730,6 @@
 
				 #define RLC_GPM_STAT__DYN_CU_POWERING_DOWN__SHIFT 0x10
			
 
				 #define RLC_GPM_STAT__ABORTED_PD_SEQUENCE_MASK 0x20000
			
 
				 #define RLC_GPM_STAT__ABORTED_PD_SEQUENCE__SHIFT 0x11
			
 
				-#define RLC_GPM_STAT__RESERVED_MASK 0xfc0000
			
 
				-#define RLC_GPM_STAT__RESERVED__SHIFT 0x12
			
 
				 #define RLC_GPM_STAT__PG_ERROR_STATUS_MASK 0xff000000
			
 
				 #define RLC_GPM_STAT__PG_ERROR_STATUS__SHIFT 0x18
			
 
				 #define RLC_GPU_CLOCK_32_RES_SEL__RES_SEL_MASK 0x3f
			
@@ -8764,8 +8762,10 @@
 
				 #define RLC_PG_CNTL__SMU_CLK_SLOWDOWN_ON_PD_ENABLE__SHIFT 0x12
			
 
				 #define RLC_PG_CNTL__SMU_HANDSHAKE_ENABLE_MASK 0x80000
			
 
				 #define RLC_PG_CNTL__SMU_HANDSHAKE_ENABLE__SHIFT 0x13
			
 
				-#define RLC_PG_CNTL__RESERVED1_MASK 0xf00000
			
 
				-#define RLC_PG_CNTL__RESERVED1__SHIFT 0x14
			
 
				+#define RLC_PG_CNTL__QUICK_PG_ENABLE_MASK 0x100000
			
 
				+#define RLC_PG_CNTL__QUICK_PG_ENABLE__SHIFT 0x14
			
 
				+#define RLC_PG_CNTL__RESERVED1_MASK 0xe00000
			
 
				+#define RLC_PG_CNTL__RESERVED1__SHIFT 0x15
			
 
				 #define RLC_GPM_THREAD_PRIORITY__THREAD0_PRIORITY_MASK 0xff
			
 
				 #define RLC_GPM_THREAD_PRIORITY__THREAD0_PRIORITY__SHIFT 0x0
			
 
				 #define RLC_GPM_THREAD_PRIORITY__THREAD1_PRIORITY_MASK 0xff00
			
@@ -9102,8 +9102,6 @@
 
				 #define RLC_GPM_LOG_CONT__CONT__SHIFT 0x0
			
 
				 #define RLC_PG_DELAY_3__CGCG_ACTIVE_BEFORE_CGPG_MASK 0xff
			
 
				 #define RLC_PG_DELAY_3__CGCG_ACTIVE_BEFORE_CGPG__SHIFT 0x0
			
 
				-#define RLC_PG_DELAY_3__RESERVED_MASK 0xffffff00
			
 
				-#define RLC_PG_DELAY_3__RESERVED__SHIFT 0x8
			
 
				 #define RLC_GPM_INT_DISABLE_TH0__DISABLE_MASK 0xffffffff
			
 
				 #define RLC_GPM_INT_DISABLE_TH0__DISABLE__SHIFT 0x0
			
 
				 #define RLC_GPM_INT_DISABLE_TH1__DISABLE_MASK 0xffffffff
			
@@ -9124,14 +9122,8 @@
 
				 #define RLC_SRM_DEBUG_SELECT__RESERVED__SHIFT 0x8
			
 
				 #define RLC_SRM_DEBUG__DATA_MASK 0xffffffff
			
 
				 #define RLC_SRM_DEBUG__DATA__SHIFT 0x0
			
 
				-#define RLC_SRM_ARAM_ADDR__ADDR_MASK 0x3ff
			
 
				-#define RLC_SRM_ARAM_ADDR__ADDR__SHIFT 0x0
			
 
				-#define RLC_SRM_ARAM_ADDR__RESERVED_MASK 0xfffffc00
			
 
				-#define RLC_SRM_ARAM_ADDR__RESERVED__SHIFT 0xa
			
 
				 #define RLC_SRM_ARAM_DATA__DATA_MASK 0xffffffff
			
 
				 #define RLC_SRM_ARAM_DATA__DATA__SHIFT 0x0
			
 
				-#define RLC_SRM_DRAM_ADDR__ADDR_MASK 0x3ff
			
 
				-#define RLC_SRM_DRAM_ADDR__ADDR__SHIFT 0x0
			
 
				 #define RLC_SRM_DRAM_ADDR__RESERVED_MASK 0xfffffc00
			
 
				 #define RLC_SRM_DRAM_ADDR__RESERVED__SHIFT 0xa
			
 
				 #define RLC_SRM_DRAM_DATA__DATA_MASK 0xffffffff
			
@@ -17946,8 +17938,6 @@
 
				 #define VGT_TESS_DISTRIBUTION__ACCUM_TRI__SHIFT 0x8
			
 
				 #define VGT_TESS_DISTRIBUTION__ACCUM_QUAD_MASK 0xff0000
			
 
				 #define VGT_TESS_DISTRIBUTION__ACCUM_QUAD__SHIFT 0x10
			
 
				-#define VGT_TESS_DISTRIBUTION__DONUT_SPLIT_MASK 0xff000000
			
 
				-#define VGT_TESS_DISTRIBUTION__DONUT_SPLIT__SHIFT 0x18
			
 
				 #define VGT_TF_RING_SIZE__SIZE_MASK 0xffff
			
 
				 #define VGT_TF_RING_SIZE__SIZE__SHIFT 0x0
			
 
				 #define VGT_SYS_CONFIG__DUAL_CORE_EN_MASK 0x1
			
@@ -20502,8 +20492,6 @@
 
				 #define DIDT_SQ_CTRL0__DIDT_CTRL_RST__SHIFT 0x4
			
 
				 #define DIDT_SQ_CTRL0__DIDT_CLK_EN_OVERRIDE_MASK 0x20
			
 
				 #define DIDT_SQ_CTRL0__DIDT_CLK_EN_OVERRIDE__SHIFT 0x5
			
 
				-#define DIDT_SQ_CTRL0__UNUSED_0_MASK 0xffffffc0
			
 
				-#define DIDT_SQ_CTRL0__UNUSED_0__SHIFT 0x6
			
 
				 #define DIDT_SQ_CTRL1__MIN_POWER_MASK 0xffff
			
 
				 #define DIDT_SQ_CTRL1__MIN_POWER__SHIFT 0x0
			
 
				 #define DIDT_SQ_CTRL1__MAX_POWER_MASK 0xffff0000
			
@@ -20558,8 +20546,6 @@
 
				 #define DIDT_DB_CTRL0__DIDT_CTRL_RST__SHIFT 0x4
			
 
				 #define DIDT_DB_CTRL0__DIDT_CLK_EN_OVERRIDE_MASK 0x20
			
 
				 #define DIDT_DB_CTRL0__DIDT_CLK_EN_OVERRIDE__SHIFT 0x5
			
 
				-#define DIDT_DB_CTRL0__UNUSED_0_MASK 0xffffffc0
			
 
				-#define DIDT_DB_CTRL0__UNUSED_0__SHIFT 0x6
			
 
				 #define DIDT_DB_CTRL1__MIN_POWER_MASK 0xffff
			
 
				 #define DIDT_DB_CTRL1__MIN_POWER__SHIFT 0x0
			
 
				 #define DIDT_DB_CTRL1__MAX_POWER_MASK 0xffff0000
			
@@ -20614,8 +20600,6 @@
 
				 #define DIDT_TD_CTRL0__DIDT_CTRL_RST__SHIFT 0x4
			
 
				 #define DIDT_TD_CTRL0__DIDT_CLK_EN_OVERRIDE_MASK 0x20
			
 
				 #define DIDT_TD_CTRL0__DIDT_CLK_EN_OVERRIDE__SHIFT 0x5
			
 
				-#define DIDT_TD_CTRL0__UNUSED_0_MASK 0xffffffc0
			
 
				-#define DIDT_TD_CTRL0__UNUSED_0__SHIFT 0x6
			
 
				 #define DIDT_TD_CTRL1__MIN_POWER_MASK 0xffff
			
 
				 #define DIDT_TD_CTRL1__MIN_POWER__SHIFT 0x0
			
 
				 #define DIDT_TD_CTRL1__MAX_POWER_MASK 0xffff0000
			
@@ -20670,8 +20654,6 @@
 
				 #define DIDT_TCP_CTRL0__DIDT_CTRL_RST__SHIFT 0x4
			
 
				 #define DIDT_TCP_CTRL0__DIDT_CLK_EN_OVERRIDE_MASK 0x20
			
 
				 #define DIDT_TCP_CTRL0__DIDT_CLK_EN_OVERRIDE__SHIFT 0x5
			
 
				-#define DIDT_TCP_CTRL0__UNUSED_0_MASK 0xffffffc0
			
 
				-#define DIDT_TCP_CTRL0__UNUSED_0__SHIFT 0x6
			
 
				 #define DIDT_TCP_CTRL1__MIN_POWER_MASK 0xffff
			
 
				 #define DIDT_TCP_CTRL1__MIN_POWER__SHIFT 0x0
			
 
				 #define DIDT_TCP_CTRL1__MAX_POWER_MASK 0xffff0000
			
@@ -20726,8 +20708,6 @@
 
				 #define DIDT_DBR_CTRL0__DIDT_CTRL_RST__SHIFT 0x4
			
 
				 #define DIDT_DBR_CTRL0__DIDT_CLK_EN_OVERRIDE_MASK 0x20
			
 
				 #define DIDT_DBR_CTRL0__DIDT_CLK_EN_OVERRIDE__SHIFT 0x5
			
 
				-#define DIDT_DBR_CTRL0__UNUSED_0_MASK 0xffffffc0
			
 
				-#define DIDT_DBR_CTRL0__UNUSED_0__SHIFT 0x6
			
 
				 #define DIDT_DBR_CTRL1__MIN_POWER_MASK 0xffff
			
 
				 #define DIDT_DBR_CTRL1__MIN_POWER__SHIFT 0x0
			
 
				 #define DIDT_DBR_CTRL1__MAX_POWER_MASK 0xffff0000
			
@@ -20773,4 +20753,84 @@
 
				 #define DIDT_DBR_WEIGHT8_11__WEIGHT11_MASK 0xff000000
			
 
				 #define DIDT_DBR_WEIGHT8_11__WEIGHT11__SHIFT 0x18
			
 
				 
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_CTRL_ENABLE_MASK    0x00000001
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_CTRL_ENABLE__SHIFT  0x00000000
			
 
				+
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_DELAY_HI_MASK       0x0000007e
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_DELAY_LO_MASK       0x00001f80L
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_DELAY_HI__SHIFT     0x00000001
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_STALL_DELAY_LO__SHIFT     0x00000007
			
 
				+
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_HI_POWER_THRESHOLD_MASK   0x1fffe000L
			
 
				+#define DIDT_SQ_STALL_CTRL__DIDT_HI_POWER_THRESHOLD__SHIFT 0x0000000d
			
 
				+
			
 
				+#define DIDT_SQ_STALL_CTRL__UNUSED_0_MASK                  0xe0000000L
			
 
				+#define DIDT_SQ_STALL_CTRL__UNUSED_0__SHIFT                0x0000001d
			
 
				+
			
 
				+#define DIDT_SQ_TUNING_CTRL__DIDT_TUNING_ENABLE_MASK       0x00000001L
			
 
				+#define DIDT_SQ_TUNING_CTRL__DIDT_TUNING_ENABLE__SHIFT     0x00000000
			
 
				+
			
 
				+#define DIDT_SQ_TUNING_CTRL__MAX_POWER_DELTA_HI_MASK       0x00007ffeL
			
 
				+#define DIDT_SQ_TUNING_CTRL__MAX_POWER_DELTA_HI__SHIFT     0x00000001
			
 
				+#define DIDT_SQ_TUNING_CTRL__MAX_POWER_DELTA_LO_MASK       0x1fff8000L
			
 
				+#define DIDT_SQ_TUNING_CTRL__MAX_POWER_DELTA_LO__SHIFT     0x0000000f
			
 
				+
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_CTRL_ENABLE_MASK    0x00000001L
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_CTRL_ENABLE__SHIFT  0x00000000
			
 
				+
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_DELAY_HI_MASK       0x0000007eL
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_DELAY_LO_MASK       0x00001f80L
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_DELAY_HI__SHIFT     0x00000001
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_STALL_DELAY_LO__SHIFT     0x00000007
			
 
				+
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_HI_POWER_THRESHOLD_MASK   0x1fffe000L
			
 
				+#define DIDT_TD_STALL_CTRL__DIDT_HI_POWER_THRESHOLD__SHIFT 0x0000000d
			
 
				+
			
 
				+#define DIDT_SQ_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI_MASK     0x00000fc0L
			
 
				+#define DIDT_SQ_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO_MASK     0x0003f000L
			
 
				+#define DIDT_SQ_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI__SHIFT   0x00000006
			
 
				+#define DIDT_SQ_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO__SHIFT   0x0000000c
			
 
				+
			
 
				+#define DIDT_TD_TUNING_CTRL__DIDT_TUNING_ENABLE_MASK       0x00000001L
			
 
				+#define DIDT_TD_TUNING_CTRL__MAX_POWER_DELTA_HI_MASK       0x00007ffeL
			
 
				+#define DIDT_TD_TUNING_CTRL__MAX_POWER_DELTA_LO_MASK       0x1fff8000L
			
 
				+
			
 
				+#define DIDT_TD_TUNING_CTRL__DIDT_TUNING_ENABLE__SHIFT     0x00000000
			
 
				+#define DIDT_TD_TUNING_CTRL__MAX_POWER_DELTA_HI__SHIFT     0x00000001
			
 
				+#define DIDT_TD_TUNING_CTRL__MAX_POWER_DELTA_LO__SHIFT     0x0000000f
			
 
				+
			
 
				+#define DIDT_TD_STALL_CTRL__UNUSED_0_MASK                  0xe0000000L
			
 
				+#define DIDT_TD_STALL_CTRL__UNUSED_0__SHIFT                0x0000001d
			
 
				+
			
 
				+#define DIDT_TD_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI_MASK     0x00000fc0L
			
 
				+#define DIDT_TD_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO_MASK     0x0003f000L
			
 
				+#define DIDT_TD_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI__SHIFT   0x00000006
			
 
				+#define DIDT_TD_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO__SHIFT   0x0000000c
			
 
				+
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_CTRL_ENABLE_MASK   0x00000001L
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_CTRL_ENABLE__SHIFT 0x00000000
			
 
				+
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_DELAY_HI_MASK      0x0000007eL
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_DELAY_LO_MASK      0x00001f80L
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_DELAY_HI__SHIFT    0x00000001
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_STALL_DELAY_LO__SHIFT    0x00000007
			
 
				+
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_HI_POWER_THRESHOLD_MASK  0x1fffe000L
			
 
				+#define DIDT_TCP_STALL_CTRL__DIDT_HI_POWER_THRESHOLD__SHIFT 0x0000000d
			
 
				+
			
 
				+#define DIDT_TCP_STALL_CTRL__UNUSED_0_MASK                 0xe0000000L
			
 
				+#define DIDT_TCP_STALL_CTRL__UNUSED_0__SHIFT               0x0000001d
			
 
				+
			
 
				+#define DIDT_TCP_TUNING_CTRL__DIDT_TUNING_ENABLE_MASK      0x00000001L
			
 
				+#define DIDT_TCP_TUNING_CTRL__MAX_POWER_DELTA_HI_MASK      0x00007ffeL
			
 
				+#define DIDT_TCP_TUNING_CTRL__MAX_POWER_DELTA_LO_MASK      0x1fff8000L
			
 
				+#define DIDT_TCP_TUNING_CTRL__DIDT_TUNING_ENABLE__SHIFT    0x00000000
			
 
				+#define DIDT_TCP_TUNING_CTRL__MAX_POWER_DELTA_HI__SHIFT    0x00000001
			
 
				+#define DIDT_TCP_TUNING_CTRL__MAX_POWER_DELTA_LO__SHIFT    0x0000000f
			
 
				+
			
 
				+#define DIDT_TCP_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI_MASK    0x00000fc0L
			
 
				+#define DIDT_TCP_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO_MASK    0x0003f000L
			
 
				+#define DIDT_TCP_CTRL0__DIDT_MAX_STALLS_ALLOWED_HI__SHIFT  0x00000006
			
 
				+#define DIDT_TCP_CTRL0__DIDT_MAX_STALLS_ALLOWED_LO__SHIFT  0x0000000c
			
 
				+
			
 
				 #endif /* GFX_8_0_SH_MASK_H */
			
--- a/drivers/gpu/drm/amd/include/cgs_common.h
+++ b/drivers/gpu/drm/amd/include/cgs_common.h
@@ -49,6 +49,7 @@ enum cgs_ind_reg {
 
				 	CGS_IND_REG__SMC,
			
 
				 	CGS_IND_REG__UVD_CTX,
			
 
				 	CGS_IND_REG__DIDT,
			
 
				+	CGS_IND_REG_GC_CAC,
			
 
				 	CGS_IND_REG__AUDIO_ENDPT
			
 
				 };
			
 
				 
			
@@ -115,6 +116,7 @@ enum cgs_system_info_id {
 
				 	CGS_SYSTEM_INFO_CG_FLAGS,
			
 
				 	CGS_SYSTEM_INFO_PG_FLAGS,
			
 
				 	CGS_SYSTEM_INFO_GFX_CU_INFO,
			
 
				+	CGS_SYSTEM_INFO_GFX_SE_INFO,
			
 
				 	CGS_SYSTEM_INFO_ID_MAXIMUM,
			
 
				 };
			
 
				 
			
@@ -189,7 +191,6 @@ typedef unsigned long cgs_handle_t;
 
				 
			
 
				 struct cgs_acpi_method_argument {
			
 
				 	uint32_t type;
			
 
				-	uint32_t method_length;
			
 
				 	uint32_t data_length;
			
 
				 	union{
			
 
				 		uint32_t value;
			
--- a/drivers/gpu/drm/amd/powerplay/amd_powerplay.c
+++ b/drivers/gpu/drm/amd/powerplay/amd_powerplay.c
@@ -536,6 +536,10 @@ int pp_dpm_dispatch_tasks(void *handle, enum amd_pp_event event_id, void *input,
 
				 	case AMD_PP_EVENT_COMPLETE_INIT:
			
 
				 		ret = pem_handle_event(pp_handle->eventmgr, event_id, &data);
			
 
				 		break;
			
 
				+	case AMD_PP_EVENT_READJUST_POWER_STATE:
			
 
				+		pp_handle->hwmgr->current_ps = pp_handle->hwmgr->boot_ps;
			
 
				+		ret = pem_handle_event(pp_handle->eventmgr, event_id, &data);
			
 
				+		break;
			
 
				 	default:
			
 
				 		break;
			
 
				 	}
			
@@ -740,12 +744,12 @@ static int pp_dpm_get_pp_table(void *handle, char **table)
 
				 
			
 
				 	PP_CHECK_HW(hwmgr);
			
 
				 
			
 
				-	if (hwmgr->hwmgr_func->get_pp_table == NULL) {
			
 
				-		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				-		return 0;
			
 
				-	}
			
 
				+	if (!hwmgr->soft_pp_table)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	*table = (char *)hwmgr->soft_pp_table;
			
 
				 
			
 
				-	return hwmgr->hwmgr_func->get_pp_table(hwmgr, table);
			
 
				+	return hwmgr->soft_pp_table_size;
			
 
				 }
			
 
				 
			
 
				 static int pp_dpm_set_pp_table(void *handle, const char *buf, size_t size)
			
@@ -759,12 +763,23 @@ static int pp_dpm_set_pp_table(void *handle, const char *buf, size_t size)
 
				 
			
 
				 	PP_CHECK_HW(hwmgr);
			
 
				 
			
 
				-	if (hwmgr->hwmgr_func->set_pp_table == NULL) {
			
 
				-		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				-		return 0;
			
 
				+	if (!hwmgr->hardcode_pp_table) {
			
 
				+		hwmgr->hardcode_pp_table =
			
 
				+				kzalloc(hwmgr->soft_pp_table_size, GFP_KERNEL);
			
 
				+
			
 
				+		if (!hwmgr->hardcode_pp_table)
			
 
				+			return -ENOMEM;
			
 
				+
			
 
				+		/* to avoid powerplay crash when hardcode pptable is empty */
			
 
				+		memcpy(hwmgr->hardcode_pp_table, hwmgr->soft_pp_table,
			
 
				+				hwmgr->soft_pp_table_size);
			
 
				 	}
			
 
				 
			
 
				-	return hwmgr->hwmgr_func->set_pp_table(hwmgr, buf, size);
			
 
				+	memcpy(hwmgr->hardcode_pp_table, buf, size);
			
 
				+
			
 
				+	hwmgr->soft_pp_table = hwmgr->hardcode_pp_table;
			
 
				+
			
 
				+	return amd_powerplay_reset(handle);
			
 
				 }
			
 
				 
			
 
				 static int pp_dpm_force_clock_level(void *handle,
			
@@ -806,6 +821,82 @@ static int pp_dpm_print_clock_levels(void *handle,
 
				 	return hwmgr->hwmgr_func->print_clock_levels(hwmgr, type, buf);
			
 
				 }
			
 
				 
			
 
				+static int pp_dpm_get_sclk_od(void *handle)
			
 
				+{
			
 
				+	struct pp_hwmgr *hwmgr;
			
 
				+
			
 
				+	if (!handle)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	hwmgr = ((struct pp_instance *)handle)->hwmgr;
			
 
				+
			
 
				+	PP_CHECK_HW(hwmgr);
			
 
				+
			
 
				+	if (hwmgr->hwmgr_func->get_sclk_od == NULL) {
			
 
				+		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				+		return 0;
			
 
				+	}
			
 
				+
			
 
				+	return hwmgr->hwmgr_func->get_sclk_od(hwmgr);
			
 
				+}
			
 
				+
			
 
				+static int pp_dpm_set_sclk_od(void *handle, uint32_t value)
			
 
				+{
			
 
				+	struct pp_hwmgr *hwmgr;
			
 
				+
			
 
				+	if (!handle)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	hwmgr = ((struct pp_instance *)handle)->hwmgr;
			
 
				+
			
 
				+	PP_CHECK_HW(hwmgr);
			
 
				+
			
 
				+	if (hwmgr->hwmgr_func->set_sclk_od == NULL) {
			
 
				+		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				+		return 0;
			
 
				+	}
			
 
				+
			
 
				+	return hwmgr->hwmgr_func->set_sclk_od(hwmgr, value);
			
 
				+}
			
 
				+
			
 
				+static int pp_dpm_get_mclk_od(void *handle)
			
 
				+{
			
 
				+	struct pp_hwmgr *hwmgr;
			
 
				+
			
 
				+	if (!handle)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	hwmgr = ((struct pp_instance *)handle)->hwmgr;
			
 
				+
			
 
				+	PP_CHECK_HW(hwmgr);
			
 
				+
			
 
				+	if (hwmgr->hwmgr_func->get_mclk_od == NULL) {
			
 
				+		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				+		return 0;
			
 
				+	}
			
 
				+
			
 
				+	return hwmgr->hwmgr_func->get_mclk_od(hwmgr);
			
 
				+}
			
 
				+
			
 
				+static int pp_dpm_set_mclk_od(void *handle, uint32_t value)
			
 
				+{
			
 
				+	struct pp_hwmgr *hwmgr;
			
 
				+
			
 
				+	if (!handle)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	hwmgr = ((struct pp_instance *)handle)->hwmgr;
			
 
				+
			
 
				+	PP_CHECK_HW(hwmgr);
			
 
				+
			
 
				+	if (hwmgr->hwmgr_func->set_mclk_od == NULL) {
			
 
				+		printk(KERN_INFO "%s was not implemented.\n", __func__);
			
 
				+		return 0;
			
 
				+	}
			
 
				+
			
 
				+	return hwmgr->hwmgr_func->set_mclk_od(hwmgr, value);
			
 
				+}
			
 
				+
			
 
				 const struct amd_powerplay_funcs pp_dpm_funcs = {
			
 
				 	.get_temperature = pp_dpm_get_temperature,
			
 
				 	.load_firmware = pp_dpm_load_fw,
			
@@ -828,6 +919,10 @@ const struct amd_powerplay_funcs pp_dpm_funcs = {
 
				 	.set_pp_table = pp_dpm_set_pp_table,
			
 
				 	.force_clock_level = pp_dpm_force_clock_level,
			
 
				 	.print_clock_levels = pp_dpm_print_clock_levels,
			
 
				+	.get_sclk_od = pp_dpm_get_sclk_od,
			
 
				+	.set_sclk_od = pp_dpm_set_sclk_od,
			
 
				+	.get_mclk_od = pp_dpm_get_mclk_od,
			
 
				+	.set_mclk_od = pp_dpm_set_mclk_od,
			
 
				 };
			
 
				 
			
 
				 static int amd_pp_instance_init(struct amd_pp_init *pp_init,
			
@@ -909,6 +1004,44 @@ int amd_powerplay_fini(void *handle)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+int amd_powerplay_reset(void *handle)
			
 
				+{
			
 
				+	struct pp_instance *instance = (struct pp_instance *)handle;
			
 
				+	struct pp_eventmgr *eventmgr;
			
 
				+	struct pem_event_data event_data = { {0} };
			
 
				+	int ret;
			
 
				+
			
 
				+	if (instance == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	eventmgr = instance->eventmgr;
			
 
				+	if (!eventmgr || !eventmgr->pp_eventmgr_fini)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	eventmgr->pp_eventmgr_fini(eventmgr);
			
 
				+
			
 
				+	ret = pp_sw_fini(handle);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				+	kfree(instance->hwmgr->ps);
			
 
				+
			
 
				+	ret = pp_sw_init(handle);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				+	hw_init_power_state_table(instance->hwmgr);
			
 
				+
			
 
				+	if (eventmgr == NULL || eventmgr->pp_eventmgr_init == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	ret = eventmgr->pp_eventmgr_init(eventmgr);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				+	return pem_handle_event(eventmgr, AMD_PP_EVENT_COMPLETE_INIT, &event_data);
			
 
				+}
			
 
				+
			
 
				 /* export this function to DAL */
			
 
				 
			
 
				 int amd_powerplay_display_configuration_change(void *handle,
			
--- a/drivers/gpu/drm/amd/powerplay/eventmgr/eventtasks.c
+++ b/drivers/gpu/drm/amd/powerplay/eventmgr/eventtasks.c
@@ -132,8 +132,7 @@ int pem_task_enable_dynamic_state_management(struct pp_eventmgr *eventmgr, struc
 
				 
			
 
				 int pem_task_disable_dynamic_state_management(struct pp_eventmgr *eventmgr, struct pem_event_data *event_data)
			
 
				 {
			
 
				-	/* TODO */
			
 
				-	return 0;
			
 
				+	return phm_disable_dynamic_state_management(eventmgr->hwmgr);
			
 
				 }
			
 
				 
			
 
				 int pem_task_enable_clock_power_gatings_tasks(struct pp_eventmgr *eventmgr, struct pem_event_data *event_data)
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/cz_clockpowergating.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/cz_clockpowergating.c
@@ -206,7 +206,7 @@ int cz_dpm_powergate_vce(struct pp_hwmgr *hwmgr, bool bgate)
 
				 							AMD_IP_BLOCK_TYPE_VCE,
			
 
				 							AMD_PG_STATE_GATE);
			
 
				 				cz_enable_disable_vce_dpm(hwmgr, false);
			
 
				-			/* TODO: to figure out why vce can't be poweroff*/
			
 
				+				cz_dpm_powerdown_vce(hwmgr);
			
 
				 				cz_hwmgr->vce_power_gated = true;
			
 
				 			} else {
			
 
				 				cz_dpm_powerup_vce(hwmgr);
			
@@ -225,6 +225,7 @@ int cz_dpm_powergate_vce(struct pp_hwmgr *hwmgr, bool bgate)
 
				 			}
			
 
				 		}
			
 
				 	} else {
			
 
				+		cz_hwmgr->vce_power_gated = bgate;
			
 
				 		cz_dpm_update_vce_dpm(hwmgr);
			
 
				 		cz_enable_disable_vce_dpm(hwmgr, !bgate);
			
 
				 		return 0;
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/cz_hwmgr.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/cz_hwmgr.c
@@ -1180,6 +1180,13 @@ static int cz_apply_state_adjust_rules(struct pp_hwmgr *hwmgr,
 
				 static int cz_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	int result = 0;
			
 
				+	struct cz_hwmgr *data;
			
 
				+
			
 
				+	data = kzalloc(sizeof(struct cz_hwmgr), GFP_KERNEL);
			
 
				+	if (data == NULL)
			
 
				+		return -ENOMEM;
			
 
				+
			
 
				+	hwmgr->backend = data;
			
 
				 
			
 
				 	result = cz_initialize_dpm_defaults(hwmgr);
			
 
				 	if (result != 0) {
			
@@ -1909,15 +1916,7 @@ static const struct pp_hwmgr_func cz_hwmgr_funcs = {
 
				 
			
 
				 int cz_hwmgr_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct cz_hwmgr *cz_hwmgr;
			
 
				-	int ret = 0;
			
 
				-
			
 
				-	cz_hwmgr = kzalloc(sizeof(struct cz_hwmgr), GFP_KERNEL);
			
 
				-	if (cz_hwmgr == NULL)
			
 
				-		return -ENOMEM;
			
 
				-
			
 
				-	hwmgr->backend = cz_hwmgr;
			
 
				 	hwmgr->hwmgr_func = &cz_hwmgr_funcs;
			
 
				 	hwmgr->pptable_func = &pptable_funcs;
			
 
				-	return ret;
			
 
				+	return 0;
			
 
				 }
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_hwmgr.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_hwmgr.c
@@ -581,25 +581,24 @@ static int fiji_patch_boot_state(struct pp_hwmgr *hwmgr,
 
				 
			
 
				 static int fiji_hwmgr_backend_fini(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (data->soft_pp_table) {
			
 
				-		kfree(data->soft_pp_table);
			
 
				-		data->soft_pp_table = NULL;
			
 
				-	}
			
 
				-
			
 
				 	return phm_hwmgr_backend_fini(hwmgr);
			
 
				 }
			
 
				 
			
 
				 static int fiji_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_hwmgr *data;
			
 
				 	uint32_t i;
			
 
				 	struct phm_ppt_v1_information *table_info =
			
 
				 			(struct phm_ppt_v1_information *)(hwmgr->pptable);
			
 
				 	bool stay_in_boot;
			
 
				 	int result;
			
 
				 
			
 
				+	data = kzalloc(sizeof(struct fiji_hwmgr), GFP_KERNEL);
			
 
				+	if (data == NULL)
			
 
				+		return -ENOMEM;
			
 
				+
			
 
				+	hwmgr->backend = data;
			
 
				+
			
 
				 	data->dll_default_on = false;
			
 
				 	data->sram_end = SMC_RAM_END;
			
 
				 
			
@@ -734,7 +733,7 @@ static int fiji_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_GEN_INFO;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_gen_cap = 0x30007;
			
 
				+			data->pcie_gen_cap = AMDGPU_DEFAULT_PCIE_GEN_MASK;
			
 
				 		else
			
 
				 			data->pcie_gen_cap = (uint32_t)sys_info.value;
			
 
				 		if (data->pcie_gen_cap & CAIL_PCIE_LINK_SPEED_SUPPORT_GEN3)
			
@@ -743,7 +742,7 @@ static int fiji_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_MLW;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_lane_cap = 0x2f0000;
			
 
				+			data->pcie_lane_cap = AMDGPU_DEFAULT_PCIE_MLW_MASK;
			
 
				 		else
			
 
				 			data->pcie_lane_cap = (uint32_t)sys_info.value;
			
 
				 	} else {
			
@@ -1236,6 +1235,34 @@ static int fiji_program_voting_clients(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int fiji_clear_voting_clients(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	/* Reset voting clients before disabling DPM */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			SCLK_PWRMGT_CNTL, RESET_SCLK_CNT, 1);
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			SCLK_PWRMGT_CNTL, RESET_BUSY_CNT, 1);
			
 
				+
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_0, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_1, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_2, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_3, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_4, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_5, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_6, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_7, 0);
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				 * Get the location of various tables inside the FW image.
			
 
				 *
			
@@ -1362,6 +1389,17 @@ static int fiji_copy_and_switch_arb_sets(struct pp_hwmgr *hwmgr,
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+/**
			
 
				+* Call SMC to reset S0/S1 to S1 and Reset SMIO to initial value
			
 
				+*
			
 
				+* @param    hwmgr  the address of the powerplay hardware manager.
			
 
				+* @return   if success then 0;
			
 
				+*/
			
 
				+static int fiji_reset_to_default(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	return smum_send_msg_to_smc(hwmgr->smumgr, PPSMC_MSG_ResetToDefaults);
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				 * Initial switch from ARB F0->F1
			
 
				 *
			
@@ -1375,6 +1413,21 @@ static int fiji_initial_switch_from_arbf0_to_f1(struct pp_hwmgr *hwmgr)
 
				 			MC_CG_ARB_FREQ_F0, MC_CG_ARB_FREQ_F1);
			
 
				 }
			
 
				 
			
 
				+static int fiji_force_switch_to_arbf0(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	uint32_t tmp;
			
 
				+
			
 
				+	tmp = (cgs_read_ind_register(hwmgr->device,
			
 
				+			CGS_IND_REG__SMC, ixSMC_SCRATCH9) &
			
 
				+			0x0000ff00) >> 8;
			
 
				+
			
 
				+	if (tmp == MC_CG_ARB_FREQ_F0)
			
 
				+		return 0;
			
 
				+
			
 
				+	return fiji_copy_and_switch_arb_sets(hwmgr,
			
 
				+			tmp, MC_CG_ARB_FREQ_F0);
			
 
				+}
			
 
				+
			
 
				 static int fiji_reset_single_dpm_table(struct pp_hwmgr *hwmgr,
			
 
				 		struct fiji_single_dpm_table *dpm_table, uint32_t count)
			
 
				 {
			
@@ -3177,6 +3230,17 @@ static int fiji_enable_ulv(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int fiji_disable_ulv(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_ulv_parm *ulv = &(data->ulv);
			
 
				+
			
 
				+	if (ulv->ulv_supported)
			
 
				+		return smum_send_msg_to_smc(hwmgr->smumgr, PPSMC_MSG_DisableULV);
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static int fiji_enable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
@@ -3197,6 +3261,21 @@ static int fiji_enable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int fiji_disable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_SclkDeepSleep)) {
			
 
				+		if (smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+				PPSMC_MSG_MASTER_DeepSleep_OFF)) {
			
 
				+			PP_ASSERT_WITH_CODE(false,
			
 
				+					"Attempt to disable Master Deep Sleep switch failed!",
			
 
				+					return -1);
			
 
				+		}
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static int fiji_enable_sclk_mclk_dpm(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
@@ -3357,6 +3436,70 @@ static int fiji_start_dpm(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int fiji_disable_sclk_mclk_dpm(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	/* disable SCLK dpm */
			
 
				+	if (!data->sclk_dpm_key_disabled)
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_DPM_Disable) == 0),
			
 
				+				"Failed to disable SCLK DPM!",
			
 
				+				return -1);
			
 
				+
			
 
				+	/* disable MCLK dpm */
			
 
				+	if (!data->mclk_dpm_key_disabled) {
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc_with_parameter(hwmgr->smumgr,
			
 
				+				PPSMC_MSG_MCLKDPM_SetEnabledMask, 1) == 0),
			
 
				+				"Failed to force MCLK DPM0!",
			
 
				+				return -1);
			
 
				+
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_MCLKDPM_Disable) == 0),
			
 
				+				"Failed to disable MCLK DPM!",
			
 
				+				return -1);
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int fiji_stop_dpm(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	/* disable general power management */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC, GENERAL_PWRMGT,
			
 
				+			GLOBAL_PWRMGT_EN, 0);
			
 
				+	/* disable sclk deep sleep */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC, SCLK_PWRMGT_CNTL,
			
 
				+			DYNAMIC_PM_EN, 0);
			
 
				+
			
 
				+	/* disable PCIE dpm */
			
 
				+	if (!data->pcie_dpm_key_disabled) {
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_PCIeDPM_Disable) == 0),
			
 
				+				"Failed to disable pcie DPM during DPM Stop Function!",
			
 
				+				return -1);
			
 
				+	}
			
 
				+
			
 
				+	if (fiji_disable_sclk_mclk_dpm(hwmgr)) {
			
 
				+		printk(KERN_ERR "Failed to disable Sclk DPM and Mclk DPM!");
			
 
				+		return -1;
			
 
				+	}
			
 
				+
			
 
				+	PP_ASSERT_WITH_CODE(
			
 
				+			(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					PPSMC_MSG_Voltage_Cntl_Disable) == 0),
			
 
				+			"Failed to disable voltage DPM during DPM Stop Function!",
			
 
				+			return -1);
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static void fiji_set_dpm_event_sources(struct pp_hwmgr *hwmgr,
			
 
				 		uint32_t sources)
			
 
				 {
			
@@ -3415,6 +3558,23 @@ static int fiji_enable_thermal_auto_throttle(struct pp_hwmgr *hwmgr)
 
				 	return fiji_enable_auto_throttle_source(hwmgr, PHM_AutoThrottleSource_Thermal);
			
 
				 }
			
 
				 
			
 
				+static int fiji_disable_auto_throttle_source(struct pp_hwmgr *hwmgr,
			
 
				+		PHM_AutoThrottleSource source)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	if (data->active_auto_throttle_sources & (1 << source)) {
			
 
				+		data->active_auto_throttle_sources &= ~(1 << source);
			
 
				+		fiji_set_dpm_event_sources(hwmgr, data->active_auto_throttle_sources);
			
 
				+	}
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int fiji_disable_thermal_auto_throttle(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	return fiji_disable_auto_throttle_source(hwmgr, PHM_AutoThrottleSource_Thermal);
			
 
				+}
			
 
				+
			
 
				 static int fiji_enable_dpm_tasks(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	int tmp_result, result = 0;
			
@@ -3529,6 +3689,64 @@ static int fiji_enable_dpm_tasks(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+static int fiji_disable_dpm_tasks(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	int tmp_result, result = 0;
			
 
				+
			
 
				+	tmp_result = (fiji_is_dpm_running(hwmgr)) ? 0 : -1;
			
 
				+	PP_ASSERT_WITH_CODE(tmp_result == 0,
			
 
				+			"DPM is not running right now, no need to disable DPM!",
			
 
				+			return 0);
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_ThermalController))
			
 
				+		PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+				GENERAL_PWRMGT, THERMAL_PROTECTION_DIS, 1);
			
 
				+
			
 
				+	tmp_result = fiji_disable_power_containment(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable power containment!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_disable_smc_cac(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable SMC CAC!", result = tmp_result);
			
 
				+
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			CG_SPLL_SPREAD_SPECTRUM, SSEN, 0);
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			GENERAL_PWRMGT, DYN_SPREAD_SPECTRUM_EN, 0);
			
 
				+
			
 
				+	tmp_result = fiji_disable_thermal_auto_throttle(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable thermal auto throttle!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_stop_dpm(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to stop DPM!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_disable_deep_sleep_master_switch(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable deep sleep master switch!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_disable_ulv(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable ULV!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_clear_voting_clients(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to clear voting clients!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_reset_to_default(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to reset to default!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = fiji_force_switch_to_arbf0(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to force to switch arbf0!", result = tmp_result);
			
 
				+
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				 static int fiji_force_dpm_highest(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
@@ -5071,42 +5289,6 @@ static int fiji_get_fan_control_mode(struct pp_hwmgr *hwmgr)
 
				 				CG_FDO_CTRL2, FDO_PWM_MODE);
			
 
				 }
			
 
				 
			
 
				-static int fiji_get_pp_table(struct pp_hwmgr *hwmgr, char **table)
			
 
				-{
			
 
				-	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kmemdup(hwmgr->soft_pp_table,
			
 
				-					      hwmgr->soft_pp_table_size,
			
 
				-					      GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	*table = (char *)&data->soft_pp_table;
			
 
				-
			
 
				-	return hwmgr->soft_pp_table_size;
			
 
				-}
			
 
				-
			
 
				-static int fiji_set_pp_table(struct pp_hwmgr *hwmgr, const char *buf, size_t size)
			
 
				-{
			
 
				-	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kzalloc(hwmgr->soft_pp_table_size, GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	memcpy(data->soft_pp_table, buf, size);
			
 
				-
			
 
				-	hwmgr->soft_pp_table = data->soft_pp_table;
			
 
				-
			
 
				-	/* TODO: re-init powerplay to implement modified pptable */
			
 
				-
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 static int fiji_force_clock_level(struct pp_hwmgr *hwmgr,
			
 
				 		enum pp_clock_type type, uint32_t mask)
			
 
				 {
			
@@ -5276,12 +5458,96 @@ bool fiji_check_smc_update_required_for_display_configuration(struct pp_hwmgr *h
 
				 	return is_update_required;
			
 
				 }
			
 
				 
			
 
				+static int fiji_get_sclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_single_dpm_table *sclk_table = &(data->dpm_table.sclk_table);
			
 
				+	struct fiji_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (sclk_table->dpm_levels[sclk_table->count - 1].value -
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int fiji_set_sclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct fiji_power_state  *fiji_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	fiji_ps = cast_phw_fiji_power_state(&ps->hardware);
			
 
				+
			
 
				+	fiji_ps->performance_levels[fiji_ps->performance_level_count - 1].engine_clock =
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int fiji_get_mclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_single_dpm_table *mclk_table = &(data->dpm_table.mclk_table);
			
 
				+	struct fiji_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (mclk_table->dpm_levels[mclk_table->count - 1].value -
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int fiji_set_mclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	struct fiji_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct fiji_power_state  *fiji_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	fiji_ps = cast_phw_fiji_power_state(&ps->hardware);
			
 
				+
			
 
				+	fiji_ps->performance_levels[fiji_ps->performance_level_count - 1].memory_clock =
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				 
			
 
				 static const struct pp_hwmgr_func fiji_hwmgr_funcs = {
			
 
				 	.backend_init = &fiji_hwmgr_backend_init,
			
 
				 	.backend_fini = &fiji_hwmgr_backend_fini,
			
 
				 	.asic_setup = &fiji_setup_asic_task,
			
 
				 	.dynamic_state_management_enable = &fiji_enable_dpm_tasks,
			
 
				+	.dynamic_state_management_disable = &fiji_disable_dpm_tasks,
			
 
				 	.force_dpm_level = &fiji_dpm_force_dpm_level,
			
 
				 	.get_num_of_pp_table_entries = &tonga_get_number_of_powerplay_table_entries,
			
 
				 	.get_power_state_size = &fiji_get_power_state_size,
			
@@ -5314,24 +5580,18 @@ static const struct pp_hwmgr_func fiji_hwmgr_funcs = {
 
				 	.get_fan_control_mode = fiji_get_fan_control_mode,
			
 
				 	.check_states_equal = fiji_check_states_equal,
			
 
				 	.check_smc_update_required_for_display_configuration = fiji_check_smc_update_required_for_display_configuration,
			
 
				-	.get_pp_table = fiji_get_pp_table,
			
 
				-	.set_pp_table = fiji_set_pp_table,
			
 
				 	.force_clock_level = fiji_force_clock_level,
			
 
				 	.print_clock_levels = fiji_print_clock_levels,
			
 
				+	.get_sclk_od = fiji_get_sclk_od,
			
 
				+	.set_sclk_od = fiji_set_sclk_od,
			
 
				+	.get_mclk_od = fiji_get_mclk_od,
			
 
				+	.set_mclk_od = fiji_set_mclk_od,
			
 
				 };
			
 
				 
			
 
				 int fiji_hwmgr_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct fiji_hwmgr  *data;
			
 
				-	int ret = 0;
			
 
				-
			
 
				-	data = kzalloc(sizeof(struct fiji_hwmgr), GFP_KERNEL);
			
 
				-	if (data == NULL)
			
 
				-		return -ENOMEM;
			
 
				-
			
 
				-	hwmgr->backend = data;
			
 
				 	hwmgr->hwmgr_func = &fiji_hwmgr_funcs;
			
 
				 	hwmgr->pptable_func = &tonga_pptable_funcs;
			
 
				 	pp_fiji_thermal_initialize(hwmgr);
			
 
				-	return ret;
			
 
				+	return 0;
			
 
				 }
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_hwmgr.h
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_hwmgr.h
@@ -302,9 +302,6 @@ struct fiji_hwmgr {
 
				 	bool                           pg_acp_init;
			
 
				 	bool                           frtc_enabled;
			
 
				 	bool                           frtc_status_changed;
			
 
				-
			
 
				-	/* soft pptable for re-uploading into smu */
			
 
				-	void *soft_pp_table;
			
 
				 };
			
 
				 
			
 
				 /* To convert to Q8.8 format for firmware */
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_powertune.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_powertune.c
@@ -72,18 +72,19 @@ void fiji_initialize_power_tune_defaults(struct pp_hwmgr *hwmgr)
 
				 	fiji_hwmgr->dte_tj_offset = tmp;
			
 
				 
			
 
				 	if (!tmp) {
			
 
				-		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				-				PHM_PlatformCaps_PowerContainment);
			
 
				-
			
 
				 		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				 				PHM_PlatformCaps_CAC);
			
 
				 
			
 
				 		fiji_hwmgr->fast_watermark_threshold = 100;
			
 
				 
			
 
				-		tmp = 1;
			
 
				-		fiji_hwmgr->enable_dte_feature = tmp ? false : true;
			
 
				-		fiji_hwmgr->enable_tdc_limit_feature = tmp ? true : false;
			
 
				-		fiji_hwmgr->enable_pkg_pwr_tracking_feature = tmp ? true : false;
			
 
				+		if (hwmgr->powercontainment_enabled) {
			
 
				+			phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				+				    PHM_PlatformCaps_PowerContainment);
			
 
				+			tmp = 1;
			
 
				+			fiji_hwmgr->enable_dte_feature = tmp ? false : true;
			
 
				+			fiji_hwmgr->enable_tdc_limit_feature = tmp ? true : false;
			
 
				+			fiji_hwmgr->enable_pkg_pwr_tracking_feature = tmp ? true : false;
			
 
				+		}
			
 
				 	}
			
 
				 }
			
 
				 
			
@@ -459,6 +460,23 @@ int fiji_enable_smc_cac(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+int fiji_disable_smc_cac(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	int result = 0;
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_CAC) && data->cac_enabled) {
			
 
				+		int smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+				(uint16_t)(PPSMC_MSG_DisableCac));
			
 
				+		PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+				"Failed to disable CAC in SMC.", result = -1);
			
 
				+
			
 
				+		data->cac_enabled = false;
			
 
				+	}
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				 int fiji_set_power_limit(struct pp_hwmgr *hwmgr, uint32_t n)
			
 
				 {
			
 
				 	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
@@ -528,6 +546,48 @@ int fiji_enable_power_containment(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+int fiji_disable_power_containment(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct fiji_hwmgr *data = (struct fiji_hwmgr *)(hwmgr->backend);
			
 
				+	int result = 0;
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_PowerContainment) &&
			
 
				+			data->power_containment_features) {
			
 
				+		int smc_result;
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_TDCLimit) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_TDCLimitDisable));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable TDCLimit in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_DTE) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_DisableDTE));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable DTE in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_PkgPwrLimit) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_PkgPwrLimitDisable));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable PkgPwrTracking in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+		data->power_containment_features = 0;
			
 
				+	}
			
 
				+
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				 int fiji_power_control_set_level(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct phm_ppt_v1_information *table_info =
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_powertune.h
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/fiji_powertune.h
@@ -36,6 +36,19 @@ enum fiji_pt_config_reg_type {
 
				 #define POWERCONTAINMENT_FEATURE_TDCLimit        0x00000002
			
 
				 #define POWERCONTAINMENT_FEATURE_PkgPwrLimit     0x00000004
			
 
				 
			
 
				+#define DIDT_SQ_CTRL0__UNUSED_0_MASK             0xffffffc0
			
 
				+#define DIDT_SQ_CTRL0__UNUSED_0__SHIFT           0x6
			
 
				+#define DIDT_TD_CTRL0__UNUSED_0_MASK             0xffffffc0
			
 
				+#define DIDT_TD_CTRL0__UNUSED_0__SHIFT           0x6
			
 
				+#define DIDT_TCP_CTRL0__UNUSED_0_MASK            0xffffffc0
			
 
				+#define DIDT_TCP_CTRL0__UNUSED_0__SHIFT          0x6
			
 
				+#define DIDT_SQ_TUNING_CTRL__UNUSED_0_MASK                 0xe0000000
			
 
				+#define DIDT_SQ_TUNING_CTRL__UNUSED_0__SHIFT               0x0000001d
			
 
				+#define DIDT_TD_TUNING_CTRL__UNUSED_0_MASK                 0xe0000000
			
 
				+#define DIDT_TD_TUNING_CTRL__UNUSED_0__SHIFT               0x0000001d
			
 
				+#define DIDT_TCP_TUNING_CTRL__UNUSED_0_MASK                0xe0000000
			
 
				+#define DIDT_TCP_TUNING_CTRL__UNUSED_0__SHIFT              0x0000001d
			
 
				+
			
 
				 struct fiji_pt_config_reg {
			
 
				 	uint32_t                           offset;
			
 
				 	uint32_t                           mask;
			
@@ -58,7 +71,9 @@ void fiji_initialize_power_tune_defaults(struct pp_hwmgr *hwmgr);
 
				 int fiji_populate_bapm_parameters_in_dpm_table(struct pp_hwmgr *hwmgr);
			
 
				 int fiji_populate_pm_fuses(struct pp_hwmgr *hwmgr);
			
 
				 int fiji_enable_smc_cac(struct pp_hwmgr *hwmgr);
			
 
				+int fiji_disable_smc_cac(struct pp_hwmgr *hwmgr);
			
 
				 int fiji_enable_power_containment(struct pp_hwmgr *hwmgr);
			
 
				+int fiji_disable_power_containment(struct pp_hwmgr *hwmgr);
			
 
				 int fiji_set_power_limit(struct pp_hwmgr *hwmgr, uint32_t n);
			
 
				 int fiji_power_control_set_level(struct pp_hwmgr *hwmgr);
			
 
				 
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/hardwaremanager.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/hardwaremanager.c
@@ -154,6 +154,30 @@ int phm_enable_dynamic_state_management(struct pp_hwmgr *hwmgr)
 
				 	return ret;
			
 
				 }
			
 
				 
			
 
				+int phm_disable_dynamic_state_management(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	int ret = -1;
			
 
				+	bool enabled;
			
 
				+
			
 
				+	PHM_FUNC_CHECK(hwmgr);
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+		PHM_PlatformCaps_TablelessHardwareInterface)) {
			
 
				+		if (hwmgr->hwmgr_func->dynamic_state_management_disable)
			
 
				+			ret = hwmgr->hwmgr_func->dynamic_state_management_disable(hwmgr);
			
 
				+	} else {
			
 
				+		ret = phm_dispatch_table(hwmgr,
			
 
				+				&(hwmgr->disable_dynamic_state_management),
			
 
				+				NULL, NULL);
			
 
				+	}
			
 
				+
			
 
				+	enabled = ret == 0 ? false : true;
			
 
				+
			
 
				+	cgs_notify_dpm_enabled(hwmgr->device, enabled);
			
 
				+
			
 
				+	return ret;
			
 
				+}
			
 
				+
			
 
				 int phm_force_dpm_levels(struct pp_hwmgr *hwmgr, enum amd_dpm_forced_level level)
			
 
				 {
			
 
				 	PHM_FUNC_CHECK(hwmgr);
			
@@ -314,7 +338,7 @@ int phm_store_dal_configuration_data(struct pp_hwmgr *hwmgr,
 
				 	if (hwmgr->hwmgr_func->store_cc6_data == NULL)
			
 
				 		return -EINVAL;
			
 
				 
			
 
				-	/* to do pass other display configuration in furture */
			
 
				+	/* TODO: pass other display configuration in the future */
			
 
				 
			
 
				 	if (hwmgr->hwmgr_func->store_cc6_data)
			
 
				 		hwmgr->hwmgr_func->store_cc6_data(hwmgr,
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/hwmgr.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/hwmgr.c
@@ -24,6 +24,7 @@
 
				 #include <linux/types.h>
			
 
				 #include <linux/kernel.h>
			
 
				 #include <linux/slab.h>
			
 
				+#include <drm/amdgpu_drm.h>
			
 
				 #include "cgs_common.h"
			
 
				 #include "power_state.h"
			
 
				 #include "hwmgr.h"
			
@@ -58,12 +59,13 @@ int hwmgr_init(struct amd_pp_init *pp_init, struct pp_instance *handle)
 
				 	hwmgr->hw_revision = pp_init->rev_id;
			
 
				 	hwmgr->usec_timeout = AMD_MAX_USEC_TIMEOUT;
			
 
				 	hwmgr->power_source = PP_PowerSource_AC;
			
 
				+	hwmgr->powercontainment_enabled = pp_init->powercontainment_enabled;
			
 
				 
			
 
				 	switch (hwmgr->chip_family) {
			
 
				-	case AMD_FAMILY_CZ:
			
 
				+	case AMDGPU_FAMILY_CZ:
			
 
				 		cz_hwmgr_init(hwmgr);
			
 
				 		break;
			
 
				-	case AMD_FAMILY_VI:
			
 
				+	case AMDGPU_FAMILY_VI:
			
 
				 		switch (hwmgr->chip_id) {
			
 
				 		case CHIP_TONGA:
			
 
				 			tonga_hwmgr_init(hwmgr);
			
@@ -94,6 +96,8 @@ int hwmgr_fini(struct pp_hwmgr *hwmgr)
 
				 		return -EINVAL;
			
 
				 
			
 
				 	/* do hwmgr finish*/
			
 
				+	kfree(hwmgr->hardcode_pp_table);
			
 
				+
			
 
				 	kfree(hwmgr->backend);
			
 
				 
			
 
				 	kfree(hwmgr->start_thermal_controller.function_list);
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_clockpowergating.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_clockpowergating.c
@@ -106,11 +106,17 @@ int polaris10_phm_powergate_uvd(struct pp_hwmgr *hwmgr, bool bgate)
 
				 	data->uvd_power_gated = bgate;
			
 
				 
			
 
				 	if (bgate) {
			
 
				+		cgs_set_clockgating_state(hwmgr->device,
			
 
				+				AMD_IP_BLOCK_TYPE_UVD,
			
 
				+				AMD_CG_STATE_GATE);
			
 
				 		polaris10_update_uvd_dpm(hwmgr, true);
			
 
				 		polaris10_phm_powerdown_uvd(hwmgr);
			
 
				 	} else {
			
 
				 		polaris10_phm_powerup_uvd(hwmgr);
			
 
				 		polaris10_update_uvd_dpm(hwmgr, false);
			
 
				+		cgs_set_clockgating_state(hwmgr->device,
			
 
				+				AMD_IP_BLOCK_TYPE_UVD,
			
 
				+				AMD_PG_STATE_UNGATE);
			
 
				 	}
			
 
				 
			
 
				 	return 0;
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_hwmgr.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_hwmgr.c
@@ -389,6 +389,34 @@ static int polaris10_program_voting_clients(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int polaris10_clear_voting_clients(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	/* Reset voting clients before disabling DPM */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			SCLK_PWRMGT_CNTL, RESET_SCLK_CNT, 1);
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			SCLK_PWRMGT_CNTL, RESET_BUSY_CNT, 1);
			
 
				+
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_0, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_1, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_2, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_3, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_4, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_5, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_6, 0);
			
 
				+	cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			ixCG_FREQ_TRAN_VOTING_7, 0);
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				 * Get the location of various tables inside the FW image.
			
 
				 *
			
@@ -515,6 +543,11 @@ static int polaris10_copy_and_switch_arb_sets(struct pp_hwmgr *hwmgr,
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int polaris10_reset_to_default(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	return smum_send_msg_to_smc(hwmgr->smumgr, PPSMC_MSG_ResetToDefaults);
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				 * Initial switch from ARB F0->F1
			
 
				 *
			
@@ -528,6 +561,21 @@ static int polaris10_initial_switch_from_arbf0_to_f1(struct pp_hwmgr *hwmgr)
 
				 			MC_CG_ARB_FREQ_F0, MC_CG_ARB_FREQ_F1);
			
 
				 }
			
 
				 
			
 
				+static int polaris10_force_switch_to_arbf0(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	uint32_t tmp;
			
 
				+
			
 
				+	tmp = (cgs_read_ind_register(hwmgr->device,
			
 
				+			CGS_IND_REG__SMC, ixSMC_SCRATCH9) &
			
 
				+			0x0000ff00) >> 8;
			
 
				+
			
 
				+	if (tmp == MC_CG_ARB_FREQ_F0)
			
 
				+		return 0;
			
 
				+
			
 
				+	return polaris10_copy_and_switch_arb_sets(hwmgr,
			
 
				+			tmp, MC_CG_ARB_FREQ_F0);
			
 
				+}
			
 
				+
			
 
				 static int polaris10_setup_default_pcie_table(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
@@ -1356,9 +1404,9 @@ static int polaris10_populate_all_memory_levels(struct pp_hwmgr *hwmgr)
 
				 			return result;
			
 
				 	}
			
 
				 
			
 
				-	/* in order to prevent MC activity from stutter mode to push DPM up.
			
 
				+	/* In order to prevent MC activity from stutter mode to push DPM up,
			
 
				 	 * the UVD change complements this by putting the MCLK in
			
 
				-	 * a higher state by default such that we are not effected by
			
 
				+	 * a higher state by default such that we are not affected by
			
 
				 	 * up threshold or and MCLK DPM latency.
			
 
				 	 */
			
 
				 	levels[0].ActivityLevel = 0x1f;
			
@@ -1865,9 +1913,8 @@ static int polaris10_populate_vr_config(struct pp_hwmgr *hwmgr,
 
				 	if (POLARIS10_VOLTAGE_CONTROL_BY_SVID2 == data->mvdd_control) {
			
 
				 		config = VR_SVI2_PLANE_2;
			
 
				 		table->VRConfig |= (config << VRCONF_MVDD_SHIFT);
			
 
				-	} else if (POLARIS10_VOLTAGE_CONTROL_BY_GPIO == data->mvdd_control) {
			
 
				-		config = VR_SMIO_PATTERN_2;
			
 
				-		table->VRConfig |= (config << VRCONF_MVDD_SHIFT);
			
 
				+		cgs_write_ind_register(hwmgr->device, CGS_IND_REG__SMC, data->soft_regs_start +
			
 
				+			offsetof(SMU74_SoftRegisters, AllowMvddSwitch), 0x1);
			
 
				 	} else {
			
 
				 		config = VR_STATIC_VOLTAGE;
			
 
				 		table->VRConfig |= (config << VRCONF_MVDD_SHIFT);
			
@@ -2237,6 +2284,17 @@ static int polaris10_enable_ulv(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int polaris10_disable_ulv(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_ulv_parm *ulv = &(data->ulv);
			
 
				+
			
 
				+	if (ulv->ulv_supported)
			
 
				+		return smum_send_msg_to_smc(hwmgr->smumgr, PPSMC_MSG_DisableULV);
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static int polaris10_enable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
@@ -2257,6 +2315,21 @@ static int polaris10_enable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int polaris10_disable_deep_sleep_master_switch(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_SclkDeepSleep)) {
			
 
				+		if (smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+				PPSMC_MSG_MASTER_DeepSleep_OFF)) {
			
 
				+			PP_ASSERT_WITH_CODE(false,
			
 
				+					"Attempt to disable Master Deep Sleep switch failed!",
			
 
				+					return -1);
			
 
				+		}
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static int polaris10_enable_sclk_mclk_dpm(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
@@ -2354,6 +2427,58 @@ static int polaris10_start_dpm(struct pp_hwmgr *hwmgr)
 
				 	return 0;
			
 
				 }
			
 
				 
			
 
				+static int polaris10_disable_sclk_mclk_dpm(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	/* disable SCLK dpm */
			
 
				+	if (!data->sclk_dpm_key_disabled)
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_DPM_Disable) == 0),
			
 
				+				"Failed to disable SCLK DPM!",
			
 
				+				return -1);
			
 
				+
			
 
				+	/* disable MCLK dpm */
			
 
				+	if (!data->mclk_dpm_key_disabled) {
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_MCLKDPM_Disable) == 0),
			
 
				+				"Failed to disable MCLK DPM!",
			
 
				+				return -1);
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int polaris10_stop_dpm(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	/* disable general power management */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC, GENERAL_PWRMGT,
			
 
				+			GLOBAL_PWRMGT_EN, 0);
			
 
				+	/* disable sclk deep sleep */
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC, SCLK_PWRMGT_CNTL,
			
 
				+			DYNAMIC_PM_EN, 0);
			
 
				+
			
 
				+	/* disable PCIE dpm */
			
 
				+	if (!data->pcie_dpm_key_disabled) {
			
 
				+		PP_ASSERT_WITH_CODE(
			
 
				+				(smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+						PPSMC_MSG_PCIeDPM_Disable) == 0),
			
 
				+				"Failed to disable pcie DPM during DPM Stop Function!",
			
 
				+				return -1);
			
 
				+	}
			
 
				+
			
 
				+	if (polaris10_disable_sclk_mclk_dpm(hwmgr)) {
			
 
				+		printk(KERN_ERR "Failed to disable Sclk DPM and Mclk DPM!");
			
 
				+		return -1;
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static void polaris10_set_dpm_event_sources(struct pp_hwmgr *hwmgr, uint32_t sources)
			
 
				 {
			
 
				 	bool protection;
			
@@ -2411,6 +2536,23 @@ static int polaris10_enable_thermal_auto_throttle(struct pp_hwmgr *hwmgr)
 
				 	return polaris10_enable_auto_throttle_source(hwmgr, PHM_AutoThrottleSource_Thermal);
			
 
				 }
			
 
				 
			
 
				+static int polaris10_disable_auto_throttle_source(struct pp_hwmgr *hwmgr,
			
 
				+		PHM_AutoThrottleSource source)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+
			
 
				+	if (data->active_auto_throttle_sources & (1 << source)) {
			
 
				+		data->active_auto_throttle_sources &= ~(1 << source);
			
 
				+		polaris10_set_dpm_event_sources(hwmgr, data->active_auto_throttle_sources);
			
 
				+	}
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int polaris10_disable_thermal_auto_throttle(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	return polaris10_disable_auto_throttle_source(hwmgr, PHM_AutoThrottleSource_Thermal);
			
 
				+}
			
 
				+
			
 
				 int polaris10_pcie_performance_request(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
@@ -2532,8 +2674,60 @@ int polaris10_enable_dpm_tasks(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 int polaris10_disable_dpm_tasks(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				+	int tmp_result, result = 0;
			
 
				 
			
 
				-	return 0;
			
 
				+	tmp_result = (polaris10_is_dpm_running(hwmgr)) ? 0 : -1;
			
 
				+	PP_ASSERT_WITH_CODE(tmp_result == 0,
			
 
				+			"DPM is not running right now, no need to disable DPM!",
			
 
				+			return 0);
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_ThermalController))
			
 
				+		PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+				GENERAL_PWRMGT, THERMAL_PROTECTION_DIS, 1);
			
 
				+
			
 
				+	tmp_result = polaris10_disable_power_containment(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable power containment!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_disable_smc_cac(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable SMC CAC!", result = tmp_result);
			
 
				+
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			CG_SPLL_SPREAD_SPECTRUM, SSEN, 0);
			
 
				+	PHM_WRITE_INDIRECT_FIELD(hwmgr->device, CGS_IND_REG__SMC,
			
 
				+			GENERAL_PWRMGT, DYN_SPREAD_SPECTRUM_EN, 0);
			
 
				+
			
 
				+	tmp_result = polaris10_disable_thermal_auto_throttle(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable thermal auto throttle!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_stop_dpm(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to stop DPM!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_disable_deep_sleep_master_switch(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable deep sleep master switch!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_disable_ulv(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to disable ULV!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_clear_voting_clients(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to clear voting clients!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_reset_to_default(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to reset to default!", result = tmp_result);
			
 
				+
			
 
				+	tmp_result = polaris10_force_switch_to_arbf0(hwmgr);
			
 
				+	PP_ASSERT_WITH_CODE((tmp_result == 0),
			
 
				+			"Failed to force to switch arbf0!", result = tmp_result);
			
 
				+
			
 
				+	return result;
			
 
				 }
			
 
				 
			
 
				 int polaris10_reset_asic_tasks(struct pp_hwmgr *hwmgr)
			
@@ -2544,13 +2738,6 @@ int polaris10_reset_asic_tasks(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 int polaris10_hwmgr_backend_fini(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (data->soft_pp_table) {
			
 
				-		kfree(data->soft_pp_table);
			
 
				-		data->soft_pp_table = NULL;
			
 
				-	}
			
 
				-
			
 
				 	return phm_hwmgr_backend_fini(hwmgr);
			
 
				 }
			
 
				 
			
@@ -2606,8 +2793,13 @@ int polaris10_set_features_platform_caps(struct pp_hwmgr *hwmgr)
 
				 	phm_cap_unset(hwmgr->platform_descriptor.platformCaps,
			
 
				 						PHM_PlatformCaps_TCPRamping);
			
 
				 
			
 
				-	phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				-					PHM_PlatformCaps_PowerContainment);
			
 
				+	if (hwmgr->powercontainment_enabled)
			
 
				+		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				+			    PHM_PlatformCaps_PowerContainment);
			
 
				+	else
			
 
				+		phm_cap_unset(hwmgr->platform_descriptor.platformCaps,
			
 
				+			    PHM_PlatformCaps_PowerContainment);
			
 
				+
			
 
				 	phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				 							PHM_PlatformCaps_CAC);
			
 
				 
			
@@ -2679,12 +2871,12 @@ static int polaris10_get_evv_voltages(struct pp_hwmgr *hwmgr)
 
				 				}
			
 
				 			}
			
 
				 
			
 
				-
			
 
				-			PP_ASSERT_WITH_CODE(0 == atomctrl_get_voltage_evv_on_sclk_ai(hwmgr,
			
 
				-							VOLTAGE_TYPE_VDDC, sclk, vv_id, &vddc),
			
 
				-						"Error retrieving EVV voltage value!",
			
 
				-						continue);
			
 
				-
			
 
				+			if (atomctrl_get_voltage_evv_on_sclk_ai(hwmgr,
			
 
				+						VOLTAGE_TYPE_VDDC,
			
 
				+						sclk, vv_id, &vddc) != 0) {
			
 
				+				printk(KERN_WARNING "failed to retrieving EVV voltage!\n");
			
 
				+				continue;
			
 
				+			}
			
 
				 
			
 
				 			/* need to make sure vddc is less than 2v or else, it could burn the ASIC. */
			
 
				 			PP_ASSERT_WITH_CODE((vddc < 2000 && vddc != 0),
			
@@ -2915,13 +3107,19 @@ static int polaris10_set_private_data_based_on_pptable(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 int polaris10_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_hwmgr *data;
			
 
				 	struct pp_atomctrl_gpio_pin_assignment gpio_pin_assignment;
			
 
				 	uint32_t temp_reg;
			
 
				 	int result;
			
 
				 	struct phm_ppt_v1_information *table_info =
			
 
				 			(struct phm_ppt_v1_information *)(hwmgr->pptable);
			
 
				 
			
 
				+	data = kzalloc(sizeof(struct polaris10_hwmgr), GFP_KERNEL);
			
 
				+	if (data == NULL)
			
 
				+		return -ENOMEM;
			
 
				+
			
 
				+	hwmgr->backend = data;
			
 
				+
			
 
				 	data->dll_default_on = false;
			
 
				 	data->sram_end = SMC_RAM_END;
			
 
				 	data->mclk_dpm0_activity_target = 0xa;
			
@@ -3094,7 +3292,7 @@ int polaris10_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_GEN_INFO;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_gen_cap = 0x30007;
			
 
				+			data->pcie_gen_cap = AMDGPU_DEFAULT_PCIE_GEN_MASK;
			
 
				 		else
			
 
				 			data->pcie_gen_cap = (uint32_t)sys_info.value;
			
 
				 		if (data->pcie_gen_cap & CAIL_PCIE_LINK_SPEED_SUPPORT_GEN3)
			
@@ -3103,7 +3301,7 @@ int polaris10_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_MLW;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_lane_cap = 0x2f0000;
			
 
				+			data->pcie_lane_cap = AMDGPU_DEFAULT_PCIE_MLW_MASK;
			
 
				 		else
			
 
				 			data->pcie_lane_cap = (uint32_t)sys_info.value;
			
 
				 
			
@@ -4753,42 +4951,6 @@ int polaris10_setup_asic_task(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				-static int polaris10_get_pp_table(struct pp_hwmgr *hwmgr, char **table)
			
 
				-{
			
 
				-	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kmemdup(hwmgr->soft_pp_table,
			
 
				-					      hwmgr->soft_pp_table_size,
			
 
				-					      GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	*table = (char *)&data->soft_pp_table;
			
 
				-
			
 
				-	return hwmgr->soft_pp_table_size;
			
 
				-}
			
 
				-
			
 
				-static int polaris10_set_pp_table(struct pp_hwmgr *hwmgr, const char *buf, size_t size)
			
 
				-{
			
 
				-	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kzalloc(hwmgr->soft_pp_table_size, GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	memcpy(data->soft_pp_table, buf, size);
			
 
				-
			
 
				-	hwmgr->soft_pp_table = data->soft_pp_table;
			
 
				-
			
 
				-	/* TODO: re-init powerplay to implement modified pptable */
			
 
				-
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 static int polaris10_force_clock_level(struct pp_hwmgr *hwmgr,
			
 
				 		enum pp_clock_type type, uint32_t mask)
			
 
				 {
			
@@ -4931,6 +5093,89 @@ static int polaris10_get_fan_control_mode(struct pp_hwmgr *hwmgr)
 
				 				CG_FDO_CTRL2, FDO_PWM_MODE);
			
 
				 }
			
 
				 
			
 
				+static int polaris10_get_sclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_single_dpm_table *sclk_table = &(data->dpm_table.sclk_table);
			
 
				+	struct polaris10_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (sclk_table->dpm_levels[sclk_table->count - 1].value -
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int polaris10_set_sclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct polaris10_power_state  *polaris10_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	polaris10_ps = cast_phw_polaris10_power_state(&ps->hardware);
			
 
				+
			
 
				+	polaris10_ps->performance_levels[polaris10_ps->performance_level_count - 1].engine_clock =
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int polaris10_get_mclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_single_dpm_table *mclk_table = &(data->dpm_table.mclk_table);
			
 
				+	struct polaris10_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (mclk_table->dpm_levels[mclk_table->count - 1].value -
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int polaris10_set_mclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	struct polaris10_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct polaris10_power_state  *polaris10_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	polaris10_ps = cast_phw_polaris10_power_state(&ps->hardware);
			
 
				+
			
 
				+	polaris10_ps->performance_levels[polaris10_ps->performance_level_count - 1].memory_clock =
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				 static const struct pp_hwmgr_func polaris10_hwmgr_funcs = {
			
 
				 	.backend_init = &polaris10_hwmgr_backend_init,
			
 
				 	.backend_fini = &polaris10_hwmgr_backend_fini,
			
@@ -4969,22 +5214,17 @@ static const struct pp_hwmgr_func polaris10_hwmgr_funcs = {
 
				 	.check_states_equal = polaris10_check_states_equal,
			
 
				 	.set_fan_control_mode = polaris10_set_fan_control_mode,
			
 
				 	.get_fan_control_mode = polaris10_get_fan_control_mode,
			
 
				-	.get_pp_table = polaris10_get_pp_table,
			
 
				-	.set_pp_table = polaris10_set_pp_table,
			
 
				 	.force_clock_level = polaris10_force_clock_level,
			
 
				 	.print_clock_levels = polaris10_print_clock_levels,
			
 
				 	.enable_per_cu_power_gating = polaris10_phm_enable_per_cu_power_gating,
			
 
				+	.get_sclk_od = polaris10_get_sclk_od,
			
 
				+	.set_sclk_od = polaris10_set_sclk_od,
			
 
				+	.get_mclk_od = polaris10_get_mclk_od,
			
 
				+	.set_mclk_od = polaris10_set_mclk_od,
			
 
				 };
			
 
				 
			
 
				 int polaris10_hwmgr_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct polaris10_hwmgr  *data;
			
 
				-
			
 
				-	data = kzalloc (sizeof(struct polaris10_hwmgr), GFP_KERNEL);
			
 
				-	if (data == NULL)
			
 
				-		return -ENOMEM;
			
 
				-
			
 
				-	hwmgr->backend = data;
			
 
				 	hwmgr->hwmgr_func = &polaris10_hwmgr_funcs;
			
 
				 	hwmgr->pptable_func = &tonga_pptable_funcs;
			
 
				 	pp_polaris10_thermal_initialize(hwmgr);
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_hwmgr.h
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_hwmgr.h
@@ -309,10 +309,6 @@ struct polaris10_hwmgr {
 
				 	uint32_t                           up_hyst;
			
 
				 	uint32_t disable_dpm_mask;
			
 
				 	bool apply_optimized_settings;
			
 
				-
			
 
				-	/* soft pptable for re-uploading into smu */
			
 
				-	void *soft_pp_table;
			
 
				-
			
 
				 	uint32_t                              avfs_vdroop_override_setting;
			
 
				 	bool                                  apply_avfs_cks_off_voltage;
			
 
				 };
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_powertune.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_powertune.c
@@ -312,6 +312,23 @@ int polaris10_enable_smc_cac(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+int polaris10_disable_smc_cac(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	int result = 0;
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_CAC) && data->cac_enabled) {
			
 
				+		int smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+				(uint16_t)(PPSMC_MSG_DisableCac));
			
 
				+		PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+				"Failed to disable CAC in SMC.", result = -1);
			
 
				+
			
 
				+		data->cac_enabled = false;
			
 
				+	}
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				 int polaris10_set_power_limit(struct pp_hwmgr *hwmgr, uint32_t n)
			
 
				 {
			
 
				 	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
@@ -373,6 +390,48 @@ int polaris10_enable_power_containment(struct pp_hwmgr *hwmgr)
 
				 	return result;
			
 
				 }
			
 
				 
			
 
				+int polaris10_disable_power_containment(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct polaris10_hwmgr *data = (struct polaris10_hwmgr *)(hwmgr->backend);
			
 
				+	int result = 0;
			
 
				+
			
 
				+	if (phm_cap_enabled(hwmgr->platform_descriptor.platformCaps,
			
 
				+			PHM_PlatformCaps_PowerContainment) &&
			
 
				+			data->power_containment_features) {
			
 
				+		int smc_result;
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_TDCLimit) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_TDCLimitDisable));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable TDCLimit in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_DTE) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_DisableDTE));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable DTE in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+
			
 
				+		if (data->power_containment_features &
			
 
				+				POWERCONTAINMENT_FEATURE_PkgPwrLimit) {
			
 
				+			smc_result = smum_send_msg_to_smc(hwmgr->smumgr,
			
 
				+					(uint16_t)(PPSMC_MSG_PkgPwrLimitDisable));
			
 
				+			PP_ASSERT_WITH_CODE((smc_result == 0),
			
 
				+					"Failed to disable PkgPwrTracking in SMC.",
			
 
				+					result = smc_result);
			
 
				+		}
			
 
				+		data->power_containment_features = 0;
			
 
				+	}
			
 
				+
			
 
				+	return result;
			
 
				+}
			
 
				+
			
 
				 int polaris10_power_control_set_level(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				 	struct phm_ppt_v1_information *table_info =
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_powertune.h
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/polaris10_powertune.h
@@ -31,6 +31,19 @@ enum polaris10_pt_config_reg_type {
 
				 	POLARIS10_CONFIGREG_MAX
			
 
				 };
			
 
				 
			
 
				+#define DIDT_SQ_CTRL0__UNUSED_0_MASK    0xfffc0000
			
 
				+#define DIDT_SQ_CTRL0__UNUSED_0__SHIFT  0x12
			
 
				+#define DIDT_TD_CTRL0__UNUSED_0_MASK    0xfffc0000
			
 
				+#define DIDT_TD_CTRL0__UNUSED_0__SHIFT  0x12
			
 
				+#define DIDT_TCP_CTRL0__UNUSED_0_MASK   0xfffc0000
			
 
				+#define DIDT_TCP_CTRL0__UNUSED_0__SHIFT 0x12
			
 
				+#define DIDT_SQ_TUNING_CTRL__UNUSED_0_MASK                 0xc0000000
			
 
				+#define DIDT_SQ_TUNING_CTRL__UNUSED_0__SHIFT               0x0000001e
			
 
				+#define DIDT_TD_TUNING_CTRL__UNUSED_0_MASK                 0xc0000000
			
 
				+#define DIDT_TD_TUNING_CTRL__UNUSED_0__SHIFT               0x0000001e
			
 
				+#define DIDT_TCP_TUNING_CTRL__UNUSED_0_MASK                0xc0000000
			
 
				+#define DIDT_TCP_TUNING_CTRL__UNUSED_0__SHIFT              0x0000001e
			
 
				+
			
 
				 /* PowerContainment Features */
			
 
				 #define POWERCONTAINMENT_FEATURE_DTE             0x00000001
			
 
				 #define POWERCONTAINMENT_FEATURE_TDCLimit        0x00000002
			
@@ -62,7 +75,9 @@ void polaris10_initialize_power_tune_defaults(struct pp_hwmgr *hwmgr);
 
				 int polaris10_populate_bapm_parameters_in_dpm_table(struct pp_hwmgr *hwmgr);
			
 
				 int polaris10_populate_pm_fuses(struct pp_hwmgr *hwmgr);
			
 
				 int polaris10_enable_smc_cac(struct pp_hwmgr *hwmgr);
			
 
				+int polaris10_disable_smc_cac(struct pp_hwmgr *hwmgr);
			
 
				 int polaris10_enable_power_containment(struct pp_hwmgr *hwmgr);
			
 
				+int polaris10_disable_power_containment(struct pp_hwmgr *hwmgr);
			
 
				 int polaris10_set_power_limit(struct pp_hwmgr *hwmgr, uint32_t n);
			
 
				 int polaris10_power_control_set_level(struct pp_hwmgr *hwmgr);
			
 
				 
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/ppatomctrl.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/ppatomctrl.c
@@ -552,13 +552,13 @@ static bool atomctrl_lookup_gpio_pin(
 
				 				pin_assignment->ucGpioPinBitShift;
			
 
				 			gpio_pin_assignment->us_gpio_pin_aindex =
			
 
				 				le16_to_cpu(pin_assignment->usGpioPin_AIndex);
			
 
				-			return false;
			
 
				+			return true;
			
 
				 		}
			
 
				 
			
 
				 		offset += offsetof(ATOM_GPIO_PIN_ASSIGNMENT, ucGPIO_ID) + 1;
			
 
				 	}
			
 
				 
			
 
				-	return true;
			
 
				+	return false;
			
 
				 }
			
 
				 
			
 
				 /**
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/processpptables.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/processpptables.c
@@ -794,15 +794,18 @@ static const ATOM_PPLIB_STATE_V2 *get_state_entry_v2(
 
				 static const ATOM_PPLIB_POWERPLAYTABLE *get_powerplay_table(
			
 
				 				     struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	const void *table_addr = NULL;
			
 
				+	const void *table_addr = hwmgr->soft_pp_table;
			
 
				 	uint8_t frev, crev;
			
 
				 	uint16_t size;
			
 
				 
			
 
				-	table_addr = cgs_atom_get_data_table(hwmgr->device,
			
 
				-			GetIndexIntoMasterTable(DATA, PowerPlayInfo),
			
 
				-			&size, &frev, &crev);
			
 
				+	if (!table_addr) {
			
 
				+		table_addr = cgs_atom_get_data_table(hwmgr->device,
			
 
				+				GetIndexIntoMasterTable(DATA, PowerPlayInfo),
			
 
				+				&size, &frev, &crev);
			
 
				 
			
 
				-	hwmgr->soft_pp_table = table_addr;
			
 
				+		hwmgr->soft_pp_table = table_addr;
			
 
				+		hwmgr->soft_pp_table_size = size;
			
 
				+	}
			
 
				 
			
 
				 	return (const ATOM_PPLIB_POWERPLAYTABLE *)table_addr;
			
 
				 }
			
@@ -1499,7 +1502,7 @@ int get_number_of_vce_state_table_entries(
 
				 	const ATOM_PPLIB_VCE_State_Table *vce_table =
			
 
				 				    get_vce_state_table(hwmgr, table);
			
 
				 
			
 
				-	if (vce_table > 0)
			
 
				+	if (vce_table)
			
 
				 		return vce_table->numEntries;
			
 
				 
			
 
				 	return 0;
			
@@ -1589,11 +1592,6 @@ static int pp_tables_initialize(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 static int pp_tables_uninitialize(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	if (NULL != hwmgr->soft_pp_table) {
			
 
				-		kfree(hwmgr->soft_pp_table);
			
 
				-		hwmgr->soft_pp_table = NULL;
			
 
				-	}
			
 
				-
			
 
				 	if (NULL != hwmgr->dyn_state.vddc_dependency_on_sclk) {
			
 
				 		kfree(hwmgr->dyn_state.vddc_dependency_on_sclk);
			
 
				 		hwmgr->dyn_state.vddc_dependency_on_sclk = NULL;
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_hwmgr.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_hwmgr.c
@@ -3026,8 +3026,8 @@ int tonga_init_smc_table(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 	reg_value = 0;
			
 
				 	if ((0 == reg_value) &&
			
 
				-		(0 == atomctrl_get_pp_assign_pin(hwmgr,
			
 
				-			VDDC_VRHOT_GPIO_PINID, &gpio_pin_assignment))) {
			
 
				+		(atomctrl_get_pp_assign_pin(hwmgr, VDDC_VRHOT_GPIO_PINID,
			
 
				+						&gpio_pin_assignment))) {
			
 
				 		table->VRHotGpio = gpio_pin_assignment.uc_gpio_pin_bit_shift;
			
 
				 		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				 			PHM_PlatformCaps_RegulatorHot);
			
@@ -3040,8 +3040,8 @@ int tonga_init_smc_table(struct pp_hwmgr *hwmgr)
 
				 	/* ACDC Switch GPIO */
			
 
				 	reg_value = 0;
			
 
				 	if ((0 == reg_value) &&
			
 
				-		(0 == atomctrl_get_pp_assign_pin(hwmgr,
			
 
				-			PP_AC_DC_SWITCH_GPIO_PINID, &gpio_pin_assignment))) {
			
 
				+		(atomctrl_get_pp_assign_pin(hwmgr, PP_AC_DC_SWITCH_GPIO_PINID,
			
 
				+						&gpio_pin_assignment))) {
			
 
				 		table->AcDcGpio = gpio_pin_assignment.uc_gpio_pin_bit_shift;
			
 
				 		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				 			PHM_PlatformCaps_AutomaticDCTransition);
			
@@ -3063,8 +3063,7 @@ int tonga_init_smc_table(struct pp_hwmgr *hwmgr)
 
				 	}
			
 
				 
			
 
				 	reg_value = 0;
			
 
				-	if ((0 == reg_value) &&
			
 
				-		(0 == atomctrl_get_pp_assign_pin(hwmgr,
			
 
				+	if ((0 == reg_value) && (atomctrl_get_pp_assign_pin(hwmgr,
			
 
				 			THERMAL_INT_OUTPUT_GPIO_PINID, &gpio_pin_assignment))) {
			
 
				 		phm_cap_set(hwmgr->platform_descriptor.platformCaps,
			
 
				 			PHM_PlatformCaps_ThermalOutGPIO);
			
@@ -4422,13 +4421,6 @@ int tonga_reset_asic_tasks(struct pp_hwmgr *hwmgr)
 
				 
			
 
				 int tonga_hwmgr_backend_fini(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (data->soft_pp_table) {
			
 
				-		kfree(data->soft_pp_table);
			
 
				-		data->soft_pp_table = NULL;
			
 
				-	}
			
 
				-
			
 
				 	return phm_hwmgr_backend_fini(hwmgr);
			
 
				 }
			
 
				 
			
@@ -4442,7 +4434,7 @@ int tonga_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 {
			
 
				 	int result = 0;
			
 
				 	SMU72_Discrete_DpmTable  *table = NULL;
			
 
				-	tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				+	tonga_hwmgr *data;
			
 
				 	pp_atomctrl_gpio_pin_assignment gpio_pin_assignment;
			
 
				 	struct phm_ppt_v1_information *pptable_info = (struct phm_ppt_v1_information *)(hwmgr->pptable);
			
 
				 	phw_tonga_ulv_parm *ulv;
			
@@ -4451,6 +4443,12 @@ int tonga_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 	PP_ASSERT_WITH_CODE((NULL != hwmgr),
			
 
				 		"Invalid Parameter!", return -1;);
			
 
				 
			
 
				+	data = kzalloc(sizeof(struct tonga_hwmgr), GFP_KERNEL);
			
 
				+	if (data == NULL)
			
 
				+		return -ENOMEM;
			
 
				+
			
 
				+	hwmgr->backend = data;
			
 
				+
			
 
				 	data->dll_defaule_on = 0;
			
 
				 	data->sram_end = SMC_RAM_END;
			
 
				 
			
@@ -4571,7 +4569,7 @@ int tonga_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 	* if ucGPIO_ID=VDDC_PCC_GPIO_PINID in GPIO_LUTable,
			
 
				 	* Peak Current Control feature is enabled and we should program PCC HW register
			
 
				 	*/
			
 
				-	if (0 == atomctrl_get_pp_assign_pin(hwmgr, VDDC_PCC_GPIO_PINID, &gpio_pin_assignment)) {
			
 
				+	if (atomctrl_get_pp_assign_pin(hwmgr, VDDC_PCC_GPIO_PINID, &gpio_pin_assignment)) {
			
 
				 		uint32_t temp_reg = cgs_read_ind_register(hwmgr->device,
			
 
				 										CGS_IND_REG__SMC, ixCNB_PWRMGT_CNTL);
			
 
				 
			
@@ -4639,7 +4637,7 @@ int tonga_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_GEN_INFO;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_gen_cap = 0x30007;
			
 
				+			data->pcie_gen_cap = AMDGPU_DEFAULT_PCIE_GEN_MASK;
			
 
				 		else
			
 
				 			data->pcie_gen_cap = (uint32_t)sys_info.value;
			
 
				 		if (data->pcie_gen_cap & CAIL_PCIE_LINK_SPEED_SUPPORT_GEN3)
			
@@ -4648,7 +4646,7 @@ int tonga_hwmgr_backend_init(struct pp_hwmgr *hwmgr)
 
				 		sys_info.info_id = CGS_SYSTEM_INFO_PCIE_MLW;
			
 
				 		result = cgs_query_system_info(hwmgr->device, &sys_info);
			
 
				 		if (result)
			
 
				-			data->pcie_lane_cap = 0x2f0000;
			
 
				+			data->pcie_lane_cap = AMDGPU_DEFAULT_PCIE_MLW_MASK;
			
 
				 		else
			
 
				 			data->pcie_lane_cap = (uint32_t)sys_info.value;
			
 
				 	} else {
			
@@ -6031,42 +6029,6 @@ static int tonga_get_fan_control_mode(struct pp_hwmgr *hwmgr)
 
				 				CG_FDO_CTRL2, FDO_PWM_MODE);
			
 
				 }
			
 
				 
			
 
				-static int tonga_get_pp_table(struct pp_hwmgr *hwmgr, char **table)
			
 
				-{
			
 
				-	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kmemdup(hwmgr->soft_pp_table,
			
 
				-					      hwmgr->soft_pp_table_size,
			
 
				-					      GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	*table = (char *)&data->soft_pp_table;
			
 
				-
			
 
				-	return hwmgr->soft_pp_table_size;
			
 
				-}
			
 
				-
			
 
				-static int tonga_set_pp_table(struct pp_hwmgr *hwmgr, const char *buf, size_t size)
			
 
				-{
			
 
				-	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				-
			
 
				-	if (!data->soft_pp_table) {
			
 
				-		data->soft_pp_table = kzalloc(hwmgr->soft_pp_table_size, GFP_KERNEL);
			
 
				-		if (!data->soft_pp_table)
			
 
				-			return -ENOMEM;
			
 
				-	}
			
 
				-
			
 
				-	memcpy(data->soft_pp_table, buf, size);
			
 
				-
			
 
				-	hwmgr->soft_pp_table = data->soft_pp_table;
			
 
				-
			
 
				-	/* TODO: re-init powerplay to implement modified pptable */
			
 
				-
			
 
				-	return 0;
			
 
				-}
			
 
				-
			
 
				 static int tonga_force_clock_level(struct pp_hwmgr *hwmgr,
			
 
				 		enum pp_clock_type type, uint32_t mask)
			
 
				 {
			
@@ -6174,11 +6136,96 @@ static int tonga_print_clock_levels(struct pp_hwmgr *hwmgr,
 
				 	return size;
			
 
				 }
			
 
				 
			
 
				+static int tonga_get_sclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				+	struct tonga_single_dpm_table *sclk_table = &(data->dpm_table.sclk_table);
			
 
				+	struct tonga_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (sclk_table->dpm_levels[sclk_table->count - 1].value -
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int tonga_set_sclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				+	struct tonga_single_dpm_table *golden_sclk_table =
			
 
				+			&(data->golden_dpm_table.sclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct tonga_power_state  *tonga_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	tonga_ps = cast_phw_tonga_power_state(&ps->hardware);
			
 
				+
			
 
				+	tonga_ps->performance_levels[tonga_ps->performance_level_count - 1].engine_clock =
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_sclk_table->dpm_levels[golden_sclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				+static int tonga_get_mclk_od(struct pp_hwmgr *hwmgr)
			
 
				+{
			
 
				+	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				+	struct tonga_single_dpm_table *mclk_table = &(data->dpm_table.mclk_table);
			
 
				+	struct tonga_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	int value;
			
 
				+
			
 
				+	value = (mclk_table->dpm_levels[mclk_table->count - 1].value -
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value) *
			
 
				+			100 /
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return value;
			
 
				+}
			
 
				+
			
 
				+static int tonga_set_mclk_od(struct pp_hwmgr *hwmgr, uint32_t value)
			
 
				+{
			
 
				+	struct tonga_hwmgr *data = (struct tonga_hwmgr *)(hwmgr->backend);
			
 
				+	struct tonga_single_dpm_table *golden_mclk_table =
			
 
				+			&(data->golden_dpm_table.mclk_table);
			
 
				+	struct pp_power_state  *ps;
			
 
				+	struct tonga_power_state  *tonga_ps;
			
 
				+
			
 
				+	if (value > 20)
			
 
				+		value = 20;
			
 
				+
			
 
				+	ps = hwmgr->request_ps;
			
 
				+
			
 
				+	if (ps == NULL)
			
 
				+		return -EINVAL;
			
 
				+
			
 
				+	tonga_ps = cast_phw_tonga_power_state(&ps->hardware);
			
 
				+
			
 
				+	tonga_ps->performance_levels[tonga_ps->performance_level_count - 1].memory_clock =
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value *
			
 
				+			value / 100 +
			
 
				+			golden_mclk_table->dpm_levels[golden_mclk_table->count - 1].value;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 static const struct pp_hwmgr_func tonga_hwmgr_funcs = {
			
 
				 	.backend_init = &tonga_hwmgr_backend_init,
			
 
				 	.backend_fini = &tonga_hwmgr_backend_fini,
			
 
				 	.asic_setup = &tonga_setup_asic_task,
			
 
				 	.dynamic_state_management_enable = &tonga_enable_dpm_tasks,
			
 
				+	.dynamic_state_management_disable = &tonga_disable_dpm_tasks,
			
 
				 	.apply_state_adjust_rules = tonga_apply_state_adjust_rules,
			
 
				 	.force_dpm_level = &tonga_force_dpm_level,
			
 
				 	.power_state_set = tonga_set_power_state_tasks,
			
@@ -6212,22 +6259,16 @@ static const struct pp_hwmgr_func tonga_hwmgr_funcs = {
 
				 	.check_states_equal = tonga_check_states_equal,
			
 
				 	.set_fan_control_mode = tonga_set_fan_control_mode,
			
 
				 	.get_fan_control_mode = tonga_get_fan_control_mode,
			
 
				-	.get_pp_table = tonga_get_pp_table,
			
 
				-	.set_pp_table = tonga_set_pp_table,
			
 
				 	.force_clock_level = tonga_force_clock_level,
			
 
				 	.print_clock_levels = tonga_print_clock_levels,
			
 
				+	.get_sclk_od = tonga_get_sclk_od,
			
 
				+	.set_sclk_od = tonga_set_sclk_od,
			
 
				+	.get_mclk_od = tonga_get_mclk_od,
			
 
				+	.set_mclk_od = tonga_set_mclk_od,
			
 
				 };
			
 
				 
			
 
				 int tonga_hwmgr_init(struct pp_hwmgr *hwmgr)
			
 
				 {
			
 
				-	tonga_hwmgr  *data;
			
 
				-
			
 
				-	data = kzalloc (sizeof(tonga_hwmgr), GFP_KERNEL);
			
 
				-	if (data == NULL)
			
 
				-		return -ENOMEM;
			
 
				-	memset(data, 0x00, sizeof(tonga_hwmgr));
			
 
				-
			
 
				-	hwmgr->backend = data;
			
 
				 	hwmgr->hwmgr_func = &tonga_hwmgr_funcs;
			
 
				 	hwmgr->pptable_func = &tonga_pptable_funcs;
			
 
				 	pp_tonga_thermal_initialize(hwmgr);
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_hwmgr.h
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_hwmgr.h
@@ -352,9 +352,6 @@ struct tonga_hwmgr {
 
				 	bool                           samu_power_gated; /* 1: gated, 0:not gated */
			
 
				 	bool                           acp_power_gated;  /* 1: gated, 0:not gated */
			
 
				 	bool                           pg_acp_init;
			
 
				-
			
 
				-	/* soft pptable for re-uploading into smu */
			
 
				-	void *soft_pp_table;
			
 
				 };
			
 
				 
			
 
				 typedef struct tonga_hwmgr tonga_hwmgr;
			
--- a/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_processpptables.c
+++ b/drivers/gpu/drm/amd/powerplay/hwmgr/tonga_processpptables.c
@@ -1077,9 +1077,6 @@ int tonga_pp_tables_uninitialize(struct pp_hwmgr *hwmgr)
 
				 	struct phm_ppt_v1_information *pp_table_information =
			
 
				 		(struct phm_ppt_v1_information *)(hwmgr->pptable);
			
 
				 
			
 
				-	if (NULL != hwmgr->soft_pp_table)
			
 
				-		hwmgr->soft_pp_table = NULL;
			
 
				-
			
 
				 	kfree(pp_table_information->vdd_dep_on_sclk);
			
 
				 	pp_table_information->vdd_dep_on_sclk = NULL;
			
 
				 
			
--- a/drivers/gpu/drm/amd/powerplay/inc/amd_powerplay.h
+++ b/drivers/gpu/drm/amd/powerplay/inc/amd_powerplay.h
@@ -132,6 +132,7 @@ struct amd_pp_init {
 
				 	uint32_t chip_family;
			
 
				 	uint32_t chip_id;
			
 
				 	uint32_t rev_id;
			
 
				+	bool powercontainment_enabled;
			
 
				 };
			
 
				 enum amd_pp_display_config_type{
			
 
				 	AMD_PP_DisplayConfigType_None = 0,
			
@@ -342,6 +343,10 @@ struct amd_powerplay_funcs {
 
				 	int (*set_pp_table)(void *handle, const char *buf, size_t size);
			
 
				 	int (*force_clock_level)(void *handle, enum pp_clock_type type, uint32_t mask);
			
 
				 	int (*print_clock_levels)(void *handle, enum pp_clock_type type, char *buf);
			
 
				+	int (*get_sclk_od)(void *handle);
			
 
				+	int (*set_sclk_od)(void *handle, uint32_t value);
			
 
				+	int (*get_mclk_od)(void *handle);
			
 
				+	int (*set_mclk_od)(void *handle, uint32_t value);
			
 
				 };
			
 
				 
			
 
				 struct amd_powerplay {
			
@@ -355,6 +360,8 @@ int amd_powerplay_init(struct amd_pp_init *pp_init,
 
				 
			
 
				 int amd_powerplay_fini(void *handle);
			
 
				 
			
 
				+int amd_powerplay_reset(void *handle);
			
 
				+
			
 
				 int amd_powerplay_display_configuration_change(void *handle,
			
 
				 		const struct amd_pp_display_configuration *input);
			
 
				 
			
--- a/drivers/gpu/drm/amd/powerplay/inc/hardwaremanager.h
+++ b/drivers/gpu/drm/amd/powerplay/inc/hardwaremanager.h
@@ -340,6 +340,7 @@ extern int phm_powergate_vce(struct pp_hwmgr *hwmgr, bool gate);
 
				 extern int phm_powerdown_uvd(struct pp_hwmgr *hwmgr);
			
 
				 extern int phm_setup_asic(struct pp_hwmgr *hwmgr);
			
 
				 extern int phm_enable_dynamic_state_management(struct pp_hwmgr *hwmgr);
			
 
				+extern int phm_disable_dynamic_state_management(struct pp_hwmgr *hwmgr);
			
 
				 extern void phm_init_dynamic_caps(struct pp_hwmgr *hwmgr);
			
 
				 extern bool phm_is_hw_access_blocked(struct pp_hwmgr *hwmgr);
			
 
				 extern int phm_block_hw_access(struct pp_hwmgr *hwmgr, bool block);
			
--- a/drivers/gpu/drm/amd/powerplay/inc/hwmgr.h
+++ b/drivers/gpu/drm/amd/powerplay/inc/hwmgr.h
@@ -278,6 +278,8 @@ struct pp_hwmgr_func {
 
				 
			
 
				 	int (*dynamic_state_management_enable)(
			
 
				 						struct pp_hwmgr *hw_mgr);
			
 
				+	int (*dynamic_state_management_disable)(
			
 
				+						struct pp_hwmgr *hw_mgr);
			
 
				 
			
 
				 	int (*patch_boot_state)(struct pp_hwmgr *hwmgr,
			
 
				 				     struct pp_hw_power_state *hw_ps);
			
@@ -333,11 +335,13 @@ struct pp_hwmgr_func {
 
				 	int (*get_clock_by_type)(struct pp_hwmgr *hwmgr, enum amd_pp_clock_type type, struct amd_pp_clocks *clocks);
			
 
				 	int (*get_max_high_clocks)(struct pp_hwmgr *hwmgr, struct amd_pp_simple_clock_info *clocks);
			
 
				 	int (*power_off_asic)(struct pp_hwmgr *hwmgr);
			
 
				-	int (*get_pp_table)(struct pp_hwmgr *hwmgr, char **table);
			
 
				-	int (*set_pp_table)(struct pp_hwmgr *hwmgr, const char *buf, size_t size);
			
 
				 	int (*force_clock_level)(struct pp_hwmgr *hwmgr, enum pp_clock_type type, uint32_t mask);
			
 
				 	int (*print_clock_levels)(struct pp_hwmgr *hwmgr, enum pp_clock_type type, char *buf);
			
 
				 	int (*enable_per_cu_power_gating)(struct pp_hwmgr *hwmgr, bool enable);
			
 
				+	int (*get_sclk_od)(struct pp_hwmgr *hwmgr);
			
 
				+	int (*set_sclk_od)(struct pp_hwmgr *hwmgr, uint32_t value);
			
 
				+	int (*get_mclk_od)(struct pp_hwmgr *hwmgr);
			
 
				+	int (*set_mclk_od)(struct pp_hwmgr *hwmgr, uint32_t value);
			
 
				 };
			
 
				 
			
 
				 struct pp_table_func {
			
@@ -578,6 +582,7 @@ struct pp_hwmgr {
 
				 	struct pp_smumgr *smumgr;
			
 
				 	const void *soft_pp_table;
			
 
				 	uint32_t soft_pp_table_size;
			
 
				+	void *hardcode_pp_table;
			
 
				 	bool need_pp_table_upload;
			
 
				 	enum amd_dpm_forced_level dpm_level;
			
 
				 	bool block_hw_access;
			
@@ -607,6 +612,7 @@ struct pp_hwmgr {
 
				 	uint32_t num_ps;
			
 
				 	struct pp_thermal_controller_info thermal_controller;
			
 
				 	bool fan_ctrl_is_in_default_mode;
			
 
				+	bool powercontainment_enabled;
			
 
				 	uint32_t fan_ctrl_default_mode;
			
 
				 	uint32_t tmin;
			
 
				 	struct phm_microcode_version_info microcode_version_info;
			
--- a/drivers/gpu/drm/amd/powerplay/smumgr/smumgr.c
+++ b/drivers/gpu/drm/amd/powerplay/smumgr/smumgr.c
@@ -23,6 +23,7 @@
 
				 #include <linux/types.h>
			
 
				 #include <linux/kernel.h>
			
 
				 #include <linux/slab.h>
			
 
				+#include <drm/amdgpu_drm.h>
			
 
				 #include "pp_instance.h"
			
 
				 #include "smumgr.h"
			
 
				 #include "cgs_common.h"
			
@@ -52,10 +53,10 @@ int smum_init(struct amd_pp_init *pp_init, struct pp_instance *handle)
 
				 	handle->smu_mgr = smumgr;
			
 
				 
			
 
				 	switch (smumgr->chip_family) {
			
 
				-	case AMD_FAMILY_CZ:
			
 
				+	case AMDGPU_FAMILY_CZ:
			
 
				 		cz_smum_init(smumgr);
			
 
				 		break;
			
 
				-	case AMD_FAMILY_VI:
			
 
				+	case AMDGPU_FAMILY_VI:
			
 
				 		switch (smumgr->chip_id) {
			
 
				 		case CHIP_TONGA:
			
 
				 			tonga_smum_init(smumgr);
			
--- a/drivers/gpu/drm/amd/scheduler/gpu_sched_trace.h
+++ b/drivers/gpu/drm/amd/scheduler/gpu_sched_trace.h
@@ -26,7 +26,7 @@ TRACE_EVENT(amd_sched_job,
 
				 	    TP_fast_assign(
			
 
				 			   __entry->entity = sched_job->s_entity;
			
 
				 			   __entry->sched_job = sched_job;
			
 
				-			   __entry->fence = &sched_job->s_fence->base;
			
 
				+			   __entry->fence = &sched_job->s_fence->finished;
			
 
				 			   __entry->name = sched_job->sched->name;
			
 
				 			   __entry->job_count = kfifo_len(
			
 
				 				   &sched_job->s_entity->job_queue) / sizeof(sched_job);
			
@@ -46,7 +46,7 @@ TRACE_EVENT(amd_sched_process_job,
 
				 		    ),
			
 
				 
			
 
				 	    TP_fast_assign(
			
 
				-		    __entry->fence = &fence->base;
			
 
				+		    __entry->fence = &fence->finished;
			
 
				 		    ),
			
 
				 	    TP_printk("fence=%p signaled", __entry->fence)
			
 
				 );
			
--- a/drivers/gpu/drm/amd/scheduler/gpu_scheduler.c
+++ b/drivers/gpu/drm/amd/scheduler/gpu_scheduler.c
@@ -32,6 +32,7 @@
 
				 
			
 
				 static bool amd_sched_entity_is_ready(struct amd_sched_entity *entity);
			
 
				 static void amd_sched_wakeup(struct amd_gpu_scheduler *sched);
			
 
				+static void amd_sched_process_job(struct fence *f, struct fence_cb *cb);
			
 
				 
			
 
				 struct kmem_cache *sched_fence_slab;
			
 
				 atomic_t sched_fence_slab_ref = ATOMIC_INIT(0);
			
@@ -140,7 +141,7 @@ int amd_sched_entity_init(struct amd_gpu_scheduler *sched,
 
				 		return r;
			
 
				 
			
 
				 	atomic_set(&entity->fence_seq, 0);
			
 
				-	entity->fence_context = fence_context_alloc(1);
			
 
				+	entity->fence_context = fence_context_alloc(2);
			
 
				 
			
 
				 	return 0;
			
 
				 }
			
@@ -251,17 +252,21 @@ static bool amd_sched_entity_add_dependency_cb(struct amd_sched_entity *entity)
 
				 
			
 
				 	s_fence = to_amd_sched_fence(fence);
			
 
				 	if (s_fence && s_fence->sched == sched) {
			
 
				-		/* Fence is from the same scheduler */
			
 
				-		if (test_bit(AMD_SCHED_FENCE_SCHEDULED_BIT, &fence->flags)) {
			
 
				-			/* Ignore it when it is already scheduled */
			
 
				-			fence_put(entity->dependency);
			
 
				-			return false;
			
 
				-		}
			
 
				 
			
 
				-		/* Wait for fence to be scheduled */
			
 
				-		entity->cb.func = amd_sched_entity_clear_dep;
			
 
				-		list_add_tail(&entity->cb.node, &s_fence->scheduled_cb);
			
 
				-		return true;
			
 
				+		/*
			
 
				+		 * Fence is from the same scheduler, only need to wait for
			
 
				+		 * it to be scheduled
			
 
				+		 */
			
 
				+		fence = fence_get(&s_fence->scheduled);
			
 
				+		fence_put(entity->dependency);
			
 
				+		entity->dependency = fence;
			
 
				+		if (!fence_add_callback(fence, &entity->cb,
			
 
				+					amd_sched_entity_clear_dep))
			
 
				+			return true;
			
 
				+
			
 
				+		/* Ignore it when it is already scheduled */
			
 
				+		fence_put(fence);
			
 
				+		return false;
			
 
				 	}
			
 
				 
			
 
				 	if (!fence_add_callback(entity->dependency, &entity->cb,
			
@@ -319,46 +324,108 @@ static bool amd_sched_entity_in(struct amd_sched_job *sched_job)
 
				 	return added;
			
 
				 }
			
 
				 
			
 
				-static void amd_sched_free_job(struct fence *f, struct fence_cb *cb) {
			
 
				-	struct amd_sched_job *job = container_of(cb, struct amd_sched_job, cb_free_job);
			
 
				-	schedule_work(&job->work_free_job);
			
 
				-}
			
 
				-
			
 
				 /* job_finish is called after hw fence signaled, and
			
 
				  * the job had already been deleted from ring_mirror_list
			
 
				  */
			
 
				-void amd_sched_job_finish(struct amd_sched_job *s_job)
			
 
				+static void amd_sched_job_finish(struct work_struct *work)
			
 
				 {
			
 
				-	struct amd_sched_job *next;
			
 
				+	struct amd_sched_job *s_job = container_of(work, struct amd_sched_job,
			
 
				+						   finish_work);
			
 
				 	struct amd_gpu_scheduler *sched = s_job->sched;
			
 
				 
			
 
				+	/* remove job from ring_mirror_list */
			
 
				+	spin_lock(&sched->job_list_lock);
			
 
				+	list_del_init(&s_job->node);
			
 
				 	if (sched->timeout != MAX_SCHEDULE_TIMEOUT) {
			
 
				-		if (cancel_delayed_work(&s_job->work_tdr))
			
 
				-			amd_sched_job_put(s_job);
			
 
				+		struct amd_sched_job *next;
			
 
				+
			
 
				+		spin_unlock(&sched->job_list_lock);
			
 
				+		cancel_delayed_work_sync(&s_job->work_tdr);
			
 
				+		spin_lock(&sched->job_list_lock);
			
 
				 
			
 
				 		/* queue TDR for next job */
			
 
				 		next = list_first_entry_or_null(&sched->ring_mirror_list,
			
 
				 						struct amd_sched_job, node);
			
 
				 
			
 
				-		if (next) {
			
 
				-			INIT_DELAYED_WORK(&next->work_tdr, s_job->timeout_callback);
			
 
				-			amd_sched_job_get(next);
			
 
				+		if (next)
			
 
				 			schedule_delayed_work(&next->work_tdr, sched->timeout);
			
 
				-		}
			
 
				 	}
			
 
				+	spin_unlock(&sched->job_list_lock);
			
 
				+	sched->ops->free_job(s_job);
			
 
				 }
			
 
				 
			
 
				-void amd_sched_job_begin(struct amd_sched_job *s_job)
			
 
				+static void amd_sched_job_finish_cb(struct fence *f, struct fence_cb *cb)
			
 
				+{
			
 
				+	struct amd_sched_job *job = container_of(cb, struct amd_sched_job,
			
 
				+						 finish_cb);
			
 
				+	schedule_work(&job->finish_work);
			
 
				+}
			
 
				+
			
 
				+static void amd_sched_job_begin(struct amd_sched_job *s_job)
			
 
				 {
			
 
				 	struct amd_gpu_scheduler *sched = s_job->sched;
			
 
				 
			
 
				+	spin_lock(&sched->job_list_lock);
			
 
				+	list_add_tail(&s_job->node, &sched->ring_mirror_list);
			
 
				 	if (sched->timeout != MAX_SCHEDULE_TIMEOUT &&
			
 
				-		list_first_entry_or_null(&sched->ring_mirror_list, struct amd_sched_job, node) == s_job)
			
 
				-	{
			
 
				-		INIT_DELAYED_WORK(&s_job->work_tdr, s_job->timeout_callback);
			
 
				-		amd_sched_job_get(s_job);
			
 
				+	    list_first_entry_or_null(&sched->ring_mirror_list,
			
 
				+				     struct amd_sched_job, node) == s_job)
			
 
				+		schedule_delayed_work(&s_job->work_tdr, sched->timeout);
			
 
				+	spin_unlock(&sched->job_list_lock);
			
 
				+}
			
 
				+
			
 
				+static void amd_sched_job_timedout(struct work_struct *work)
			
 
				+{
			
 
				+	struct amd_sched_job *job = container_of(work, struct amd_sched_job,
			
 
				+						 work_tdr.work);
			
 
				+
			
 
				+	job->sched->ops->timedout_job(job);
			
 
				+}
			
 
				+
			
 
				+void amd_sched_hw_job_reset(struct amd_gpu_scheduler *sched)
			
 
				+{
			
 
				+	struct amd_sched_job *s_job;
			
 
				+
			
 
				+	spin_lock(&sched->job_list_lock);
			
 
				+	list_for_each_entry_reverse(s_job, &sched->ring_mirror_list, node) {
			
 
				+		if (fence_remove_callback(s_job->s_fence->parent, &s_job->s_fence->cb)) {
			
 
				+			fence_put(s_job->s_fence->parent);
			
 
				+			s_job->s_fence->parent = NULL;
			
 
				+		}
			
 
				+	}
			
 
				+	spin_unlock(&sched->job_list_lock);
			
 
				+}
			
 
				+
			
 
				+void amd_sched_job_recovery(struct amd_gpu_scheduler *sched)
			
 
				+{
			
 
				+	struct amd_sched_job *s_job;
			
 
				+	int r;
			
 
				+
			
 
				+	spin_lock(&sched->job_list_lock);
			
 
				+	s_job = list_first_entry_or_null(&sched->ring_mirror_list,
			
 
				+					 struct amd_sched_job, node);
			
 
				+	if (s_job)
			
 
				 		schedule_delayed_work(&s_job->work_tdr, sched->timeout);
			
 
				+
			
 
				+	list_for_each_entry(s_job, &sched->ring_mirror_list, node) {
			
 
				+		struct amd_sched_fence *s_fence = s_job->s_fence;
			
 
				+		struct fence *fence = sched->ops->run_job(s_job);
			
 
				+		if (fence) {
			
 
				+			s_fence->parent = fence_get(fence);
			
 
				+			r = fence_add_callback(fence, &s_fence->cb,
			
 
				+					       amd_sched_process_job);
			
 
				+			if (r == -ENOENT)
			
 
				+				amd_sched_process_job(fence, &s_fence->cb);
			
 
				+			else if (r)
			
 
				+				DRM_ERROR("fence add callback failed (%d)\n",
			
 
				+					  r);
			
 
				+			fence_put(fence);
			
 
				+		} else {
			
 
				+			DRM_ERROR("Failed to run job!\n");
			
 
				+			amd_sched_process_job(NULL, &s_fence->cb);
			
 
				+		}
			
 
				 	}
			
 
				+	spin_unlock(&sched->job_list_lock);
			
 
				 }
			
 
				 
			
 
				 /**
			
@@ -372,36 +439,29 @@ void amd_sched_entity_push_job(struct amd_sched_job *sched_job)
 
				 {
			
 
				 	struct amd_sched_entity *entity = sched_job->s_entity;
			
 
				 
			
 
				-	sched_job->use_sched = 1;
			
 
				-	fence_add_callback(&sched_job->s_fence->base,
			
 
				-					&sched_job->cb_free_job, amd_sched_free_job);
			
 
				 	trace_amd_sched_job(sched_job);
			
 
				+	fence_add_callback(&sched_job->s_fence->finished, &sched_job->finish_cb,
			
 
				+			   amd_sched_job_finish_cb);
			
 
				 	wait_event(entity->sched->job_scheduled,
			
 
				 		   amd_sched_entity_in(sched_job));
			
 
				 }
			
 
				 
			
 
				 /* init a sched_job with basic field */
			
 
				 int amd_sched_job_init(struct amd_sched_job *job,
			
 
				-						struct amd_gpu_scheduler *sched,
			
 
				-						struct amd_sched_entity *entity,
			
 
				-						void (*timeout_cb)(struct work_struct *work),
			
 
				-						void (*free_cb)(struct kref *refcount),
			
 
				-						void *owner, struct fence **fence)
			
 
				+		       struct amd_gpu_scheduler *sched,
			
 
				+		       struct amd_sched_entity *entity,
			
 
				+		       void *owner)
			
 
				 {
			
 
				-	INIT_LIST_HEAD(&job->node);
			
 
				-	kref_init(&job->refcount);
			
 
				 	job->sched = sched;
			
 
				 	job->s_entity = entity;
			
 
				 	job->s_fence = amd_sched_fence_create(entity, owner);
			
 
				 	if (!job->s_fence)
			
 
				 		return -ENOMEM;
			
 
				 
			
 
				-	job->s_fence->s_job = job;
			
 
				-	job->timeout_callback = timeout_cb;
			
 
				-	job->free_callback = free_cb;
			
 
				+	INIT_WORK(&job->finish_work, amd_sched_job_finish);
			
 
				+	INIT_LIST_HEAD(&job->node);
			
 
				+	INIT_DELAYED_WORK(&job->work_tdr, amd_sched_job_timedout);
			
 
				 
			
 
				-	if (fence)
			
 
				-		*fence = &job->s_fence->base;
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -450,23 +510,25 @@ static void amd_sched_process_job(struct fence *f, struct fence_cb *cb)
 
				 	struct amd_sched_fence *s_fence =
			
 
				 		container_of(cb, struct amd_sched_fence, cb);
			
 
				 	struct amd_gpu_scheduler *sched = s_fence->sched;
			
 
				-	unsigned long flags;
			
 
				 
			
 
				 	atomic_dec(&sched->hw_rq_count);
			
 
				-
			
 
				-	/* remove job from ring_mirror_list */
			
 
				-	spin_lock_irqsave(&sched->job_list_lock, flags);
			
 
				-	list_del_init(&s_fence->s_job->node);
			
 
				-	sched->ops->finish_job(s_fence->s_job);
			
 
				-	spin_unlock_irqrestore(&sched->job_list_lock, flags);
			
 
				-
			
 
				-	amd_sched_fence_signal(s_fence);
			
 
				+	amd_sched_fence_finished(s_fence);
			
 
				 
			
 
				 	trace_amd_sched_process_job(s_fence);
			
 
				-	fence_put(&s_fence->base);
			
 
				+	fence_put(&s_fence->finished);
			
 
				 	wake_up_interruptible(&sched->wake_up_worker);
			
 
				 }
			
 
				 
			
 
				+static bool amd_sched_blocked(struct amd_gpu_scheduler *sched)
			
 
				+{
			
 
				+	if (kthread_should_park()) {
			
 
				+		kthread_parkme();
			
 
				+		return true;
			
 
				+	}
			
 
				+
			
 
				+	return false;
			
 
				+}
			
 
				+
			
 
				 static int amd_sched_main(void *param)
			
 
				 {
			
 
				 	struct sched_param sparam = {.sched_priority = 1};
			
@@ -476,14 +538,15 @@ static int amd_sched_main(void *param)
 
				 	sched_setscheduler(current, SCHED_FIFO, &sparam);
			
 
				 
			
 
				 	while (!kthread_should_stop()) {
			
 
				-		struct amd_sched_entity *entity;
			
 
				+		struct amd_sched_entity *entity = NULL;
			
 
				 		struct amd_sched_fence *s_fence;
			
 
				 		struct amd_sched_job *sched_job;
			
 
				 		struct fence *fence;
			
 
				 
			
 
				 		wait_event_interruptible(sched->wake_up_worker,
			
 
				-			(entity = amd_sched_select_entity(sched)) ||
			
 
				-			kthread_should_stop());
			
 
				+					 (!amd_sched_blocked(sched) &&
			
 
				+					  (entity = amd_sched_select_entity(sched))) ||
			
 
				+					 kthread_should_stop());
			
 
				 
			
 
				 		if (!entity)
			
 
				 			continue;
			
@@ -495,16 +558,19 @@ static int amd_sched_main(void *param)
 
				 		s_fence = sched_job->s_fence;
			
 
				 
			
 
				 		atomic_inc(&sched->hw_rq_count);
			
 
				-		amd_sched_job_pre_schedule(sched, sched_job);
			
 
				+		amd_sched_job_begin(sched_job);
			
 
				+
			
 
				 		fence = sched->ops->run_job(sched_job);
			
 
				 		amd_sched_fence_scheduled(s_fence);
			
 
				 		if (fence) {
			
 
				+			s_fence->parent = fence_get(fence);
			
 
				 			r = fence_add_callback(fence, &s_fence->cb,
			
 
				 					       amd_sched_process_job);
			
 
				 			if (r == -ENOENT)
			
 
				 				amd_sched_process_job(fence, &s_fence->cb);
			
 
				 			else if (r)
			
 
				-				DRM_ERROR("fence add callback failed (%d)\n", r);
			
 
				+				DRM_ERROR("fence add callback failed (%d)\n",
			
 
				+					  r);
			
 
				 			fence_put(fence);
			
 
				 		} else {
			
 
				 			DRM_ERROR("Failed to run job!\n");
			
--- a/drivers/gpu/drm/amd/scheduler/gpu_scheduler.h
+++ b/drivers/gpu/drm/amd/scheduler/gpu_scheduler.h
@@ -27,8 +27,6 @@
 
				 #include <linux/kfifo.h>
			
 
				 #include <linux/fence.h>
			
 
				 
			
 
				-#define AMD_SCHED_FENCE_SCHEDULED_BIT	FENCE_FLAG_USER_BITS
			
 
				-
			
 
				 struct amd_gpu_scheduler;
			
 
				 struct amd_sched_rq;
			
 
				 
			
@@ -68,36 +66,34 @@ struct amd_sched_rq {
 
				 };
			
 
				 
			
 
				 struct amd_sched_fence {
			
 
				-	struct fence                    base;
			
 
				+	struct fence                    scheduled;
			
 
				+	struct fence                    finished;
			
 
				 	struct fence_cb                 cb;
			
 
				-	struct list_head		scheduled_cb;
			
 
				+	struct fence                    *parent;
			
 
				 	struct amd_gpu_scheduler	*sched;
			
 
				 	spinlock_t			lock;
			
 
				 	void                            *owner;
			
 
				-	struct amd_sched_job	*s_job;
			
 
				 };
			
 
				 
			
 
				 struct amd_sched_job {
			
 
				-	struct kref refcount;
			
 
				 	struct amd_gpu_scheduler        *sched;
			
 
				 	struct amd_sched_entity         *s_entity;
			
 
				 	struct amd_sched_fence          *s_fence;
			
 
				-	bool	use_sched;	/* true if the job goes to scheduler */
			
 
				-	struct fence_cb                cb_free_job;
			
 
				-	struct work_struct             work_free_job;
			
 
				-	struct list_head			   node;
			
 
				-	struct delayed_work work_tdr;
			
 
				-	void (*timeout_callback) (struct work_struct *work);
			
 
				-	void (*free_callback)(struct kref *refcount);
			
 
				+	struct fence_cb			finish_cb;
			
 
				+	struct work_struct		finish_work;
			
 
				+	struct list_head		node;
			
 
				+	struct delayed_work		work_tdr;
			
 
				 };
			
 
				 
			
 
				-extern const struct fence_ops amd_sched_fence_ops;
			
 
				+extern const struct fence_ops amd_sched_fence_ops_scheduled;
			
 
				+extern const struct fence_ops amd_sched_fence_ops_finished;
			
 
				 static inline struct amd_sched_fence *to_amd_sched_fence(struct fence *f)
			
 
				 {
			
 
				-	struct amd_sched_fence *__f = container_of(f, struct amd_sched_fence, base);
			
 
				+	if (f->ops == &amd_sched_fence_ops_scheduled)
			
 
				+		return container_of(f, struct amd_sched_fence, scheduled);
			
 
				 
			
 
				-	if (__f->base.ops == &amd_sched_fence_ops)
			
 
				-		return __f;
			
 
				+	if (f->ops == &amd_sched_fence_ops_finished)
			
 
				+		return container_of(f, struct amd_sched_fence, finished);
			
 
				 
			
 
				 	return NULL;
			
 
				 }
			
@@ -109,8 +105,8 @@ static inline struct amd_sched_fence *to_amd_sched_fence(struct fence *f)
 
				 struct amd_sched_backend_ops {
			
 
				 	struct fence *(*dependency)(struct amd_sched_job *sched_job);
			
 
				 	struct fence *(*run_job)(struct amd_sched_job *sched_job);
			
 
				-	void (*begin_job)(struct amd_sched_job *sched_job);
			
 
				-	void (*finish_job)(struct amd_sched_job *sched_job);
			
 
				+	void (*timedout_job)(struct amd_sched_job *sched_job);
			
 
				+	void (*free_job)(struct amd_sched_job *sched_job);
			
 
				 };
			
 
				 
			
 
				 enum amd_sched_priority {
			
@@ -152,25 +148,11 @@ void amd_sched_entity_push_job(struct amd_sched_job *sched_job);
 
				 struct amd_sched_fence *amd_sched_fence_create(
			
 
				 	struct amd_sched_entity *s_entity, void *owner);
			
 
				 void amd_sched_fence_scheduled(struct amd_sched_fence *fence);
			
 
				-void amd_sched_fence_signal(struct amd_sched_fence *fence);
			
 
				+void amd_sched_fence_finished(struct amd_sched_fence *fence);
			
 
				 int amd_sched_job_init(struct amd_sched_job *job,
			
 
				-					struct amd_gpu_scheduler *sched,
			
 
				-					struct amd_sched_entity *entity,
			
 
				-					void (*timeout_cb)(struct work_struct *work),
			
 
				-					void (*free_cb)(struct kref* refcount),
			
 
				-					void *owner, struct fence **fence);
			
 
				-void amd_sched_job_pre_schedule(struct amd_gpu_scheduler *sched ,
			
 
				-								struct amd_sched_job *s_job);
			
 
				-void amd_sched_job_finish(struct amd_sched_job *s_job);
			
 
				-void amd_sched_job_begin(struct amd_sched_job *s_job);
			
 
				-static inline void amd_sched_job_get(struct amd_sched_job *job) {
			
 
				-	if (job)
			
 
				-		kref_get(&job->refcount);
			
 
				-}
			
 
				-
			
 
				-static inline void amd_sched_job_put(struct amd_sched_job *job) {
			
 
				-	if (job)
			
 
				-		kref_put(&job->refcount, job->free_callback);
			
 
				-}
			
 
				-
			
 
				+		       struct amd_gpu_scheduler *sched,
			
 
				+		       struct amd_sched_entity *entity,
			
 
				+		       void *owner);
			
 
				+void amd_sched_hw_job_reset(struct amd_gpu_scheduler *sched);
			
 
				+void amd_sched_job_recovery(struct amd_gpu_scheduler *sched);
			
 
				 #endif
			
--- a/drivers/gpu/drm/amd/scheduler/sched_fence.c
+++ b/drivers/gpu/drm/amd/scheduler/sched_fence.c
@@ -27,7 +27,8 @@
 
				 #include <drm/drmP.h>
			
 
				 #include "gpu_scheduler.h"
			
 
				 
			
 
				-struct amd_sched_fence *amd_sched_fence_create(struct amd_sched_entity *s_entity, void *owner)
			
 
				+struct amd_sched_fence *amd_sched_fence_create(struct amd_sched_entity *entity,
			
 
				+					       void *owner)
			
 
				 {
			
 
				 	struct amd_sched_fence *fence = NULL;
			
 
				 	unsigned seq;
			
@@ -36,46 +37,37 @@ struct amd_sched_fence *amd_sched_fence_create(struct amd_sched_entity *s_entity
 
				 	if (fence == NULL)
			
 
				 		return NULL;
			
 
				 
			
 
				-	INIT_LIST_HEAD(&fence->scheduled_cb);
			
 
				 	fence->owner = owner;
			
 
				-	fence->sched = s_entity->sched;
			
 
				+	fence->sched = entity->sched;
			
 
				 	spin_lock_init(&fence->lock);
			
 
				 
			
 
				-	seq = atomic_inc_return(&s_entity->fence_seq);
			
 
				-	fence_init(&fence->base, &amd_sched_fence_ops, &fence->lock,
			
 
				-		   s_entity->fence_context, seq);
			
 
				+	seq = atomic_inc_return(&entity->fence_seq);
			
 
				+	fence_init(&fence->scheduled, &amd_sched_fence_ops_scheduled,
			
 
				+		   &fence->lock, entity->fence_context, seq);
			
 
				+	fence_init(&fence->finished, &amd_sched_fence_ops_finished,
			
 
				+		   &fence->lock, entity->fence_context + 1, seq);
			
 
				 
			
 
				 	return fence;
			
 
				 }
			
 
				 
			
 
				-void amd_sched_fence_signal(struct amd_sched_fence *fence)
			
 
				+void amd_sched_fence_scheduled(struct amd_sched_fence *fence)
			
 
				 {
			
 
				-	int ret = fence_signal(&fence->base);
			
 
				+	int ret = fence_signal(&fence->scheduled);
			
 
				+
			
 
				 	if (!ret)
			
 
				-		FENCE_TRACE(&fence->base, "signaled from irq context\n");
			
 
				+		FENCE_TRACE(&fence->scheduled, "signaled from irq context\n");
			
 
				 	else
			
 
				-		FENCE_TRACE(&fence->base, "was already signaled\n");
			
 
				-}
			
 
				-
			
 
				-void amd_sched_job_pre_schedule(struct amd_gpu_scheduler *sched ,
			
 
				-				struct amd_sched_job *s_job)
			
 
				-{
			
 
				-	unsigned long flags;
			
 
				-	spin_lock_irqsave(&sched->job_list_lock, flags);
			
 
				-	list_add_tail(&s_job->node, &sched->ring_mirror_list);
			
 
				-	sched->ops->begin_job(s_job);
			
 
				-	spin_unlock_irqrestore(&sched->job_list_lock, flags);
			
 
				+		FENCE_TRACE(&fence->scheduled, "was already signaled\n");
			
 
				 }
			
 
				 
			
 
				-void amd_sched_fence_scheduled(struct amd_sched_fence *s_fence)
			
 
				+void amd_sched_fence_finished(struct amd_sched_fence *fence)
			
 
				 {
			
 
				-	struct fence_cb *cur, *tmp;
			
 
				+	int ret = fence_signal(&fence->finished);
			
 
				 
			
 
				-	set_bit(AMD_SCHED_FENCE_SCHEDULED_BIT, &s_fence->base.flags);
			
 
				-	list_for_each_entry_safe(cur, tmp, &s_fence->scheduled_cb, node) {
			
 
				-		list_del_init(&cur->node);
			
 
				-		cur->func(&s_fence->base, cur);
			
 
				-	}
			
 
				+	if (!ret)
			
 
				+		FENCE_TRACE(&fence->finished, "signaled from irq context\n");
			
 
				+	else
			
 
				+		FENCE_TRACE(&fence->finished, "was already signaled\n");
			
 
				 }
			
 
				 
			
 
				 static const char *amd_sched_fence_get_driver_name(struct fence *fence)
			
@@ -105,6 +97,8 @@ static void amd_sched_fence_free(struct rcu_head *rcu)
 
				 {
			
 
				 	struct fence *f = container_of(rcu, struct fence, rcu);
			
 
				 	struct amd_sched_fence *fence = to_amd_sched_fence(f);
			
 
				+
			
 
				+	fence_put(fence->parent);
			
 
				 	kmem_cache_free(sched_fence_slab, fence);
			
 
				 }
			
 
				 
			
@@ -116,16 +110,41 @@ static void amd_sched_fence_free(struct rcu_head *rcu)
 
				  * This function is called when the reference count becomes zero.
			
 
				  * It just RCU schedules freeing up the fence.
			
 
				  */
			
 
				-static void amd_sched_fence_release(struct fence *f)
			
 
				+static void amd_sched_fence_release_scheduled(struct fence *f)
			
 
				 {
			
 
				-	call_rcu(&f->rcu, amd_sched_fence_free);
			
 
				+	struct amd_sched_fence *fence = to_amd_sched_fence(f);
			
 
				+
			
 
				+	call_rcu(&fence->finished.rcu, amd_sched_fence_free);
			
 
				 }
			
 
				 
			
 
				-const struct fence_ops amd_sched_fence_ops = {
			
 
				+/**
			
 
				+ * amd_sched_fence_release_scheduled - drop extra reference
			
 
				+ *
			
 
				+ * @f: fence
			
 
				+ *
			
 
				+ * Drop the extra reference from the scheduled fence to the base fence.
			
 
				+ */
			
 
				+static void amd_sched_fence_release_finished(struct fence *f)
			
 
				+{
			
 
				+	struct amd_sched_fence *fence = to_amd_sched_fence(f);
			
 
				+
			
 
				+	fence_put(&fence->scheduled);
			
 
				+}
			
 
				+
			
 
				+const struct fence_ops amd_sched_fence_ops_scheduled = {
			
 
				+	.get_driver_name = amd_sched_fence_get_driver_name,
			
 
				+	.get_timeline_name = amd_sched_fence_get_timeline_name,
			
 
				+	.enable_signaling = amd_sched_fence_enable_signaling,
			
 
				+	.signaled = NULL,
			
 
				+	.wait = fence_default_wait,
			
 
				+	.release = amd_sched_fence_release_scheduled,
			
 
				+};
			
 
				+
			
 
				+const struct fence_ops amd_sched_fence_ops_finished = {
			
 
				 	.get_driver_name = amd_sched_fence_get_driver_name,
			
 
				 	.get_timeline_name = amd_sched_fence_get_timeline_name,
			
 
				 	.enable_signaling = amd_sched_fence_enable_signaling,
			
 
				 	.signaled = NULL,
			
 
				 	.wait = fence_default_wait,
			
 
				-	.release = amd_sched_fence_release,
			
 
				+	.release = amd_sched_fence_release_finished,
			
 
				 };
			
--- a/drivers/gpu/drm/ast/ast_ttm.c
+++ b/drivers/gpu/drm/ast/ast_ttm.c
@@ -186,17 +186,6 @@ static void ast_ttm_io_mem_free(struct ttm_bo_device *bdev, struct ttm_mem_reg *
 
				 {
			
 
				 }
			
 
				 
			
 
				-static int ast_bo_move(struct ttm_buffer_object *bo,
			
 
				-		       bool evict, bool interruptible,
			
 
				-		       bool no_wait_gpu,
			
 
				-		       struct ttm_mem_reg *new_mem)
			
 
				-{
			
 
				-	int r;
			
 
				-	r = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				-	return r;
			
 
				-}
			
 
				-
			
 
				-
			
 
				 static void ast_ttm_backend_destroy(struct ttm_tt *tt)
			
 
				 {
			
 
				 	ttm_tt_fini(tt);
			
@@ -241,7 +230,7 @@ struct ttm_bo_driver ast_bo_driver = {
 
				 	.ttm_tt_unpopulate = ast_ttm_tt_unpopulate,
			
 
				 	.init_mem_type = ast_bo_init_mem_type,
			
 
				 	.evict_flags = ast_bo_evict_flags,
			
 
				-	.move = ast_bo_move,
			
 
				+	.move = NULL,
			
 
				 	.verify_access = ast_bo_verify_access,
			
 
				 	.io_mem_reserve = &ast_ttm_io_mem_reserve,
			
 
				 	.io_mem_free = &ast_ttm_io_mem_free,
			
--- a/drivers/gpu/drm/bochs/bochs_mm.c
+++ b/drivers/gpu/drm/bochs/bochs_mm.c
@@ -165,15 +165,6 @@ static void bochs_ttm_io_mem_free(struct ttm_bo_device *bdev,
 
				 {
			
 
				 }
			
 
				 
			
 
				-static int bochs_bo_move(struct ttm_buffer_object *bo,
			
 
				-			 bool evict, bool interruptible,
			
 
				-			 bool no_wait_gpu,
			
 
				-			 struct ttm_mem_reg *new_mem)
			
 
				-{
			
 
				-	return ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				-}
			
 
				-
			
 
				-
			
 
				 static void bochs_ttm_backend_destroy(struct ttm_tt *tt)
			
 
				 {
			
 
				 	ttm_tt_fini(tt);
			
@@ -208,7 +199,7 @@ struct ttm_bo_driver bochs_bo_driver = {
 
				 	.ttm_tt_unpopulate = ttm_pool_unpopulate,
			
 
				 	.init_mem_type = bochs_bo_init_mem_type,
			
 
				 	.evict_flags = bochs_bo_evict_flags,
			
 
				-	.move = bochs_bo_move,
			
 
				+	.move = NULL,
			
 
				 	.verify_access = bochs_bo_verify_access,
			
 
				 	.io_mem_reserve = &bochs_ttm_io_mem_reserve,
			
 
				 	.io_mem_free = &bochs_ttm_io_mem_free,
			
--- a/drivers/gpu/drm/cirrus/cirrus_ttm.c
+++ b/drivers/gpu/drm/cirrus/cirrus_ttm.c
@@ -186,17 +186,6 @@ static void cirrus_ttm_io_mem_free(struct ttm_bo_device *bdev, struct ttm_mem_re
 
				 {
			
 
				 }
			
 
				 
			
 
				-static int cirrus_bo_move(struct ttm_buffer_object *bo,
			
 
				-		       bool evict, bool interruptible,
			
 
				-		       bool no_wait_gpu,
			
 
				-		       struct ttm_mem_reg *new_mem)
			
 
				-{
			
 
				-	int r;
			
 
				-	r = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				-	return r;
			
 
				-}
			
 
				-
			
 
				-
			
 
				 static void cirrus_ttm_backend_destroy(struct ttm_tt *tt)
			
 
				 {
			
 
				 	ttm_tt_fini(tt);
			
@@ -241,7 +230,7 @@ struct ttm_bo_driver cirrus_bo_driver = {
 
				 	.ttm_tt_unpopulate = cirrus_ttm_tt_unpopulate,
			
 
				 	.init_mem_type = cirrus_bo_init_mem_type,
			
 
				 	.evict_flags = cirrus_bo_evict_flags,
			
 
				-	.move = cirrus_bo_move,
			
 
				+	.move = NULL,
			
 
				 	.verify_access = cirrus_bo_verify_access,
			
 
				 	.io_mem_reserve = &cirrus_ttm_io_mem_reserve,
			
 
				 	.io_mem_free = &cirrus_ttm_io_mem_free,
			
--- a/drivers/gpu/drm/mgag200/mgag200_ttm.c
+++ b/drivers/gpu/drm/mgag200/mgag200_ttm.c
@@ -186,17 +186,6 @@ static void mgag200_ttm_io_mem_free(struct ttm_bo_device *bdev, struct ttm_mem_r
 
				 {
			
 
				 }
			
 
				 
			
 
				-static int mgag200_bo_move(struct ttm_buffer_object *bo,
			
 
				-		       bool evict, bool interruptible,
			
 
				-		       bool no_wait_gpu,
			
 
				-		       struct ttm_mem_reg *new_mem)
			
 
				-{
			
 
				-	int r;
			
 
				-	r = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				-	return r;
			
 
				-}
			
 
				-
			
 
				-
			
 
				 static void mgag200_ttm_backend_destroy(struct ttm_tt *tt)
			
 
				 {
			
 
				 	ttm_tt_fini(tt);
			
@@ -241,7 +230,7 @@ struct ttm_bo_driver mgag200_bo_driver = {
 
				 	.ttm_tt_unpopulate = mgag200_ttm_tt_unpopulate,
			
 
				 	.init_mem_type = mgag200_bo_init_mem_type,
			
 
				 	.evict_flags = mgag200_bo_evict_flags,
			
 
				-	.move = mgag200_bo_move,
			
 
				+	.move = NULL,
			
 
				 	.verify_access = mgag200_bo_verify_access,
			
 
				 	.io_mem_reserve = &mgag200_ttm_io_mem_reserve,
			
 
				 	.io_mem_free = &mgag200_ttm_io_mem_free,
			
--- a/drivers/gpu/drm/nouveau/nouveau_bo.c
+++ b/drivers/gpu/drm/nouveau/nouveau_bo.c
@@ -1082,7 +1082,6 @@ nouveau_bo_move_m2mf(struct ttm_buffer_object *bo, int evict, bool intr,
 
				 				ret = ttm_bo_move_accel_cleanup(bo,
			
 
				 								&fence->base,
			
 
				 								evict,
			
 
				-								no_wait_gpu,
			
 
				 								new_mem);
			
 
				 				nouveau_fence_unref(&fence);
			
 
				 			}
			
@@ -1289,6 +1288,10 @@ nouveau_bo_move(struct ttm_buffer_object *bo, bool evict, bool intr,
 
				 	struct nouveau_drm_tile *new_tile = NULL;
			
 
				 	int ret = 0;
			
 
				 
			
 
				+	ret = ttm_bo_wait(bo, intr, no_wait_gpu);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				 	if (nvbo->pin_refcnt)
			
 
				 		NV_WARN(drm, "Moving pinned object %p!\n", nvbo);
			
 
				 
			
@@ -1324,7 +1327,7 @@ nouveau_bo_move(struct ttm_buffer_object *bo, bool evict, bool intr,
 
				 	/* Fallback to software copy. */
			
 
				 	ret = ttm_bo_wait(bo, intr, no_wait_gpu);
			
 
				 	if (ret == 0)
			
 
				-		ret = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				+		ret = ttm_bo_move_memcpy(bo, evict, intr, no_wait_gpu, new_mem);
			
 
				 
			
 
				 out:
			
 
				 	if (drm->device.info.family < NV_DEVICE_INFO_V0_TESLA) {
			
--- a/drivers/gpu/drm/qxl/qxl_ttm.c
+++ b/drivers/gpu/drm/qxl/qxl_ttm.c
@@ -350,11 +350,19 @@ static int qxl_bo_move(struct ttm_buffer_object *bo,
 
				 		       struct ttm_mem_reg *new_mem)
			
 
				 {
			
 
				 	struct ttm_mem_reg *old_mem = &bo->mem;
			
 
				+	int ret;
			
 
				+
			
 
				+	ret = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				+
			
 
				 	if (old_mem->mem_type == TTM_PL_SYSTEM && bo->ttm == NULL) {
			
 
				 		qxl_move_null(bo, new_mem);
			
 
				 		return 0;
			
 
				 	}
			
 
				-	return ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				+	return ttm_bo_move_memcpy(bo, evict, interruptible,
			
 
				+				  no_wait_gpu, new_mem);
			
 
				 }
			
 
				 
			
 
				 static void qxl_bo_move_notify(struct ttm_buffer_object *bo,
			
--- a/drivers/gpu/drm/radeon/cik.c
+++ b/drivers/gpu/drm/radeon/cik.c
@@ -53,6 +53,7 @@ MODULE_FIRMWARE("radeon/bonaire_mc.bin");
 
				 MODULE_FIRMWARE("radeon/bonaire_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/bonaire_sdma.bin");
			
 
				 MODULE_FIRMWARE("radeon/bonaire_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/bonaire_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/HAWAII_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/HAWAII_me.bin");
			
@@ -72,6 +73,7 @@ MODULE_FIRMWARE("radeon/hawaii_mc.bin");
 
				 MODULE_FIRMWARE("radeon/hawaii_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/hawaii_sdma.bin");
			
 
				 MODULE_FIRMWARE("radeon/hawaii_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/hawaii_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/KAVERI_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/KAVERI_me.bin");
			
@@ -1990,12 +1992,17 @@ static int cik_init_microcode(struct radeon_device *rdev)
 
				 	int new_fw = 0;
			
 
				 	int err;
			
 
				 	int num_fw;
			
 
				+	bool new_smc = false;
			
 
				 
			
 
				 	DRM_DEBUG("\n");
			
 
				 
			
 
				 	switch (rdev->family) {
			
 
				 	case CHIP_BONAIRE:
			
 
				 		chip_name = "BONAIRE";
			
 
				+		if ((rdev->pdev->revision == 0x80) ||
			
 
				+		    (rdev->pdev->revision == 0x81) ||
			
 
				+		    (rdev->pdev->device == 0x665f))
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "bonaire";
			
 
				 		pfp_req_size = CIK_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = CIK_ME_UCODE_SIZE * 4;
			
@@ -2010,6 +2017,8 @@ static int cik_init_microcode(struct radeon_device *rdev)
 
				 		break;
			
 
				 	case CHIP_HAWAII:
			
 
				 		chip_name = "HAWAII";
			
 
				+		if (rdev->pdev->revision == 0x80)
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "hawaii";
			
 
				 		pfp_req_size = CIK_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = CIK_ME_UCODE_SIZE * 4;
			
@@ -2259,7 +2268,10 @@ static int cik_init_microcode(struct radeon_device *rdev)
 
				 			}
			
 
				 		}
			
 
				 
			
 
				-		snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", new_chip_name);
			
 
				+		if (new_smc)
			
 
				+			snprintf(fw_name, sizeof(fw_name), "radeon/%s_k_smc.bin", new_chip_name);
			
 
				+		else
			
 
				+			snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", new_chip_name);
			
 
				 		err = request_firmware(&rdev->smc_fw, fw_name, rdev->dev);
			
 
				 		if (err) {
			
 
				 			snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", chip_name);
			
@@ -8354,7 +8366,8 @@ static int cik_startup(struct radeon_device *rdev)
 
				 		}
			
 
				 	}
			
 
				 	rdev->rlc.cs_data = ci_cs_data;
			
 
				-	rdev->rlc.cp_table_size = CP_ME_TABLE_SIZE * 5 * 4;
			
 
				+	rdev->rlc.cp_table_size = ALIGN(CP_ME_TABLE_SIZE * 5 * 4, 2048); /* CP JT */
			
 
				+	rdev->rlc.cp_table_size += 64 * 1024; /* GDS */
			
 
				 	r = sumo_rlc_init(rdev);
			
 
				 	if (r) {
			
 
				 		DRM_ERROR("Failed to init rlc BOs!\n");
			
--- a/drivers/gpu/drm/radeon/evergreen_cs.c
+++ b/drivers/gpu/drm/radeon/evergreen_cs.c
@@ -2209,6 +2209,12 @@ static int evergreen_packet3_check(struct radeon_cs_parser *p,
 
				 		}
			
 
				 		break;
			
 
				 	}
			
 
				+	case PACKET3_PFP_SYNC_ME:
			
 
				+		if (pkt->count) {
			
 
				+			DRM_ERROR("bad PFP_SYNC_ME\n");
			
 
				+			return -EINVAL;
			
 
				+		}
			
 
				+		break;
			
 
				 	case PACKET3_SURFACE_SYNC:
			
 
				 		if (pkt->count != 3) {
			
 
				 			DRM_ERROR("bad SURFACE_SYNC\n");
			
@@ -3381,6 +3387,7 @@ static int evergreen_vm_packet3_check(struct radeon_device *rdev,
 
				 	case PACKET3_MPEG_INDEX:
			
 
				 	case PACKET3_WAIT_REG_MEM:
			
 
				 	case PACKET3_MEM_WRITE:
			
 
				+	case PACKET3_PFP_SYNC_ME:
			
 
				 	case PACKET3_SURFACE_SYNC:
			
 
				 	case PACKET3_EVENT_WRITE:
			
 
				 	case PACKET3_EVENT_WRITE_EOP:
			
--- a/drivers/gpu/drm/radeon/evergreend.h
+++ b/drivers/gpu/drm/radeon/evergreend.h
@@ -1624,6 +1624,7 @@
 
				 		 */
			
 
				 #              define PACKET3_CP_DMA_CMD_SAIC      (1 << 28)
			
 
				 #              define PACKET3_CP_DMA_CMD_DAIC      (1 << 29)
			
 
				+#define	PACKET3_PFP_SYNC_ME				0x42
			
 
				 #define	PACKET3_SURFACE_SYNC				0x43
			
 
				 #              define PACKET3_CB0_DEST_BASE_ENA    (1 << 6)
			
 
				 #              define PACKET3_CB1_DEST_BASE_ENA    (1 << 7)
			
--- a/drivers/gpu/drm/radeon/radeon_atpx_handler.c
+++ b/drivers/gpu/drm/radeon/radeon_atpx_handler.c
@@ -10,6 +10,7 @@
 
				 #include <linux/slab.h>
			
 
				 #include <linux/acpi.h>
			
 
				 #include <linux/pci.h>
			
 
				+#include <linux/delay.h>
			
 
				 
			
 
				 #include "radeon_acpi.h"
			
 
				 
			
@@ -27,6 +28,7 @@ struct radeon_atpx_functions {
 
				 struct radeon_atpx {
			
 
				 	acpi_handle handle;
			
 
				 	struct radeon_atpx_functions functions;
			
 
				+	bool is_hybrid;
			
 
				 };
			
 
				 
			
 
				 static struct radeon_atpx_priv {
			
@@ -62,6 +64,14 @@ bool radeon_has_atpx(void) {
 
				 	return radeon_atpx_priv.atpx_detected;
			
 
				 }
			
 
				 
			
 
				+bool radeon_has_atpx_dgpu_power_cntl(void) {
			
 
				+	return radeon_atpx_priv.atpx.functions.power_cntl;
			
 
				+}
			
 
				+
			
 
				+bool radeon_is_atpx_hybrid(void) {
			
 
				+	return radeon_atpx_priv.atpx.is_hybrid;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * radeon_atpx_call - call an ATPX method
			
 
				  *
			
@@ -141,18 +151,12 @@ static void radeon_atpx_parse_functions(struct radeon_atpx_functions *f, u32 mas
 
				  */
			
 
				 static int radeon_atpx_validate(struct radeon_atpx *atpx)
			
 
				 {
			
 
				-	/* make sure required functions are enabled */
			
 
				-	/* dGPU power control is required */
			
 
				-	if (atpx->functions.power_cntl == false) {
			
 
				-		printk("ATPX dGPU power cntl not present, forcing\n");
			
 
				-		atpx->functions.power_cntl = true;
			
 
				-	}
			
 
				+	u32 valid_bits = 0;
			
 
				 
			
 
				 	if (atpx->functions.px_params) {
			
 
				 		union acpi_object *info;
			
 
				 		struct atpx_px_params output;
			
 
				 		size_t size;
			
 
				-		u32 valid_bits;
			
 
				 
			
 
				 		info = radeon_atpx_call(atpx->handle, ATPX_FUNCTION_GET_PX_PARAMETERS, NULL);
			
 
				 		if (!info)
			
@@ -171,19 +175,42 @@ static int radeon_atpx_validate(struct radeon_atpx *atpx)
 
				 		memcpy(&output, info->buffer.pointer, size);
			
 
				 
			
 
				 		valid_bits = output.flags & output.valid_flags;
			
 
				-		/* if separate mux flag is set, mux controls are required */
			
 
				-		if (valid_bits & ATPX_SEPARATE_MUX_FOR_I2C) {
			
 
				-			atpx->functions.i2c_mux_cntl = true;
			
 
				-			atpx->functions.disp_mux_cntl = true;
			
 
				-		}
			
 
				-		/* if any outputs are muxed, mux controls are required */
			
 
				-		if (valid_bits & (ATPX_CRT1_RGB_SIGNAL_MUXED |
			
 
				-				  ATPX_TV_SIGNAL_MUXED |
			
 
				-				  ATPX_DFP_SIGNAL_MUXED))
			
 
				-			atpx->functions.disp_mux_cntl = true;
			
 
				 
			
 
				 		kfree(info);
			
 
				 	}
			
 
				+
			
 
				+	/* if separate mux flag is set, mux controls are required */
			
 
				+	if (valid_bits & ATPX_SEPARATE_MUX_FOR_I2C) {
			
 
				+		atpx->functions.i2c_mux_cntl = true;
			
 
				+		atpx->functions.disp_mux_cntl = true;
			
 
				+	}
			
 
				+	/* if any outputs are muxed, mux controls are required */
			
 
				+	if (valid_bits & (ATPX_CRT1_RGB_SIGNAL_MUXED |
			
 
				+			  ATPX_TV_SIGNAL_MUXED |
			
 
				+			  ATPX_DFP_SIGNAL_MUXED))
			
 
				+		atpx->functions.disp_mux_cntl = true;
			
 
				+
			
 
				+	/* some bioses set these bits rather than flagging power_cntl as supported */
			
 
				+	if (valid_bits & (ATPX_DYNAMIC_PX_SUPPORTED |
			
 
				+			  ATPX_DYNAMIC_DGPU_POWER_OFF_SUPPORTED))
			
 
				+		atpx->functions.power_cntl = true;
			
 
				+
			
 
				+	atpx->is_hybrid = false;
			
 
				+	if (valid_bits & ATPX_MS_HYBRID_GFX_SUPPORTED) {
			
 
				+		printk("ATPX Hybrid Graphics\n");
			
 
				+#if 1
			
 
				+		/* This is a temporary hack until the D3 cold support
			
 
				+		 * makes it upstream.  The ATPX power_control method seems
			
 
				+		 * to still work on even if the system should be using
			
 
				+		 * the new standardized hybrid D3 cold ACPI interface.
			
 
				+		 */
			
 
				+		atpx->functions.power_cntl = true;
			
 
				+#else
			
 
				+		atpx->functions.power_cntl = false;
			
 
				+#endif
			
 
				+		atpx->is_hybrid = true;
			
 
				+	}
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -258,6 +285,10 @@ static int radeon_atpx_set_discrete_state(struct radeon_atpx *atpx, u8 state)
 
				 		if (!info)
			
 
				 			return -EIO;
			
 
				 		kfree(info);
			
 
				+
			
 
				+		/* 200ms delay is required after off */
			
 
				+		if (state == 0)
			
 
				+			msleep(200);
			
 
				 	}
			
 
				 	return 0;
			
 
				 }
			
--- a/drivers/gpu/drm/radeon/radeon_connectors.c
+++ b/drivers/gpu/drm/radeon/radeon_connectors.c
@@ -2064,7 +2064,6 @@ radeon_add_atom_connector(struct drm_device *dev,
 
				 							   RADEON_OUTPUT_CSC_BYPASS);
			
 
				 			/* no HPD on analog connectors */
			
 
				 			radeon_connector->hpd.hpd = RADEON_HPD_NONE;
			
 
				-			connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				 			connector->interlace_allowed = true;
			
 
				 			connector->doublescan_allowed = true;
			
 
				 			break;
			
@@ -2314,8 +2313,10 @@ radeon_add_atom_connector(struct drm_device *dev,
 
				 	}
			
 
				 
			
 
				 	if (radeon_connector->hpd.hpd == RADEON_HPD_NONE) {
			
 
				-		if (i2c_bus->valid)
			
 
				-			connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				+		if (i2c_bus->valid) {
			
 
				+			connector->polled = DRM_CONNECTOR_POLL_CONNECT |
			
 
				+			                    DRM_CONNECTOR_POLL_DISCONNECT;
			
 
				+		}
			
 
				 	} else
			
 
				 		connector->polled = DRM_CONNECTOR_POLL_HPD;
			
 
				 
			
@@ -2391,7 +2392,6 @@ radeon_add_legacy_connector(struct drm_device *dev,
 
				 					      1);
			
 
				 		/* no HPD on analog connectors */
			
 
				 		radeon_connector->hpd.hpd = RADEON_HPD_NONE;
			
 
				-		connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				 		connector->interlace_allowed = true;
			
 
				 		connector->doublescan_allowed = true;
			
 
				 		break;
			
@@ -2476,10 +2476,13 @@ radeon_add_legacy_connector(struct drm_device *dev,
 
				 	}
			
 
				 
			
 
				 	if (radeon_connector->hpd.hpd == RADEON_HPD_NONE) {
			
 
				-		if (i2c_bus->valid)
			
 
				-			connector->polled = DRM_CONNECTOR_POLL_CONNECT;
			
 
				+		if (i2c_bus->valid) {
			
 
				+			connector->polled = DRM_CONNECTOR_POLL_CONNECT |
			
 
				+			                    DRM_CONNECTOR_POLL_DISCONNECT;
			
 
				+		}
			
 
				 	} else
			
 
				 		connector->polled = DRM_CONNECTOR_POLL_HPD;
			
 
				+
			
 
				 	connector->display_info.subpixel_order = subpixel_order;
			
 
				 	drm_connector_register(connector);
			
 
				 }
			
--- a/drivers/gpu/drm/radeon/radeon_drv.c
+++ b/drivers/gpu/drm/radeon/radeon_drv.c
@@ -93,9 +93,10 @@
 
				  *   2.43.0 - RADEON_INFO_GPU_RESET_COUNTER
			
 
				  *   2.44.0 - SET_APPEND_CNT packet3 support
			
 
				  *   2.45.0 - Allow setting shader registers using DMA/COPY packet3 on SI
			
 
				+ *   2.46.0 - Add PFP_SYNC_ME support on evergreen
			
 
				  */
			
 
				 #define KMS_DRIVER_MAJOR	2
			
 
				-#define KMS_DRIVER_MINOR	45
			
 
				+#define KMS_DRIVER_MINOR	46
			
 
				 #define KMS_DRIVER_PATCHLEVEL	0
			
 
				 int radeon_driver_load_kms(struct drm_device *dev, unsigned long flags);
			
 
				 int radeon_driver_unload_kms(struct drm_device *dev);
			
@@ -162,9 +163,13 @@ void radeon_debugfs_cleanup(struct drm_minor *minor);
 
				 #if defined(CONFIG_VGA_SWITCHEROO)
			
 
				 void radeon_register_atpx_handler(void);
			
 
				 void radeon_unregister_atpx_handler(void);
			
 
				+bool radeon_has_atpx_dgpu_power_cntl(void);
			
 
				+bool radeon_is_atpx_hybrid(void);
			
 
				 #else
			
 
				 static inline void radeon_register_atpx_handler(void) {}
			
 
				 static inline void radeon_unregister_atpx_handler(void) {}
			
 
				+static inline bool radeon_has_atpx_dgpu_power_cntl(void) { return false; }
			
 
				+static inline bool radeon_is_atpx_hybrid(void) { return false; }
			
 
				 #endif
			
 
				 
			
 
				 int radeon_no_wb;
			
@@ -404,7 +409,10 @@ static int radeon_pmops_runtime_suspend(struct device *dev)
 
				 	pci_save_state(pdev);
			
 
				 	pci_disable_device(pdev);
			
 
				 	pci_ignore_hotplug(pdev);
			
 
				-	pci_set_power_state(pdev, PCI_D3cold);
			
 
				+	if (radeon_is_atpx_hybrid())
			
 
				+		pci_set_power_state(pdev, PCI_D3cold);
			
 
				+	else if (!radeon_has_atpx_dgpu_power_cntl())
			
 
				+		pci_set_power_state(pdev, PCI_D3hot);
			
 
				 	drm_dev->switch_power_state = DRM_SWITCH_POWER_DYNAMIC_OFF;
			
 
				 
			
 
				 	return 0;
			
@@ -421,7 +429,9 @@ static int radeon_pmops_runtime_resume(struct device *dev)
 
				 
			
 
				 	drm_dev->switch_power_state = DRM_SWITCH_POWER_CHANGING;
			
 
				 
			
 
				-	pci_set_power_state(pdev, PCI_D0);
			
 
				+	if (radeon_is_atpx_hybrid() ||
			
 
				+	    !radeon_has_atpx_dgpu_power_cntl())
			
 
				+		pci_set_power_state(pdev, PCI_D0);
			
 
				 	pci_restore_state(pdev);
			
 
				 	ret = pci_enable_device(pdev);
			
 
				 	if (ret)
			
--- a/drivers/gpu/drm/radeon/radeon_ttm.c
+++ b/drivers/gpu/drm/radeon/radeon_ttm.c
@@ -300,8 +300,7 @@ static int radeon_move_blit(struct ttm_buffer_object *bo,
 
				 	if (IS_ERR(fence))
			
 
				 		return PTR_ERR(fence);
			
 
				 
			
 
				-	r = ttm_bo_move_accel_cleanup(bo, &fence->base,
			
 
				-				      evict, no_wait_gpu, new_mem);
			
 
				+	r = ttm_bo_move_accel_cleanup(bo, &fence->base, evict, new_mem);
			
 
				 	radeon_fence_unref(&fence);
			
 
				 	return r;
			
 
				 }
			
@@ -403,6 +402,10 @@ static int radeon_bo_move(struct ttm_buffer_object *bo,
 
				 	struct ttm_mem_reg *old_mem = &bo->mem;
			
 
				 	int r;
			
 
				 
			
 
				+	r = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				+	if (r)
			
 
				+		return r;
			
 
				+
			
 
				 	/* Can't move a pinned BO */
			
 
				 	rbo = container_of(bo, struct radeon_bo, tbo);
			
 
				 	if (WARN_ON_ONCE(rbo->pin_count > 0))
			
@@ -441,7 +444,8 @@ static int radeon_bo_move(struct ttm_buffer_object *bo,
 
				 
			
 
				 	if (r) {
			
 
				 memcpy:
			
 
				-		r = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, new_mem);
			
 
				+		r = ttm_bo_move_memcpy(bo, evict, interruptible,
			
 
				+				       no_wait_gpu, new_mem);
			
 
				 		if (r) {
			
 
				 			return r;
			
 
				 		}
			
--- a/drivers/gpu/drm/radeon/si.c
+++ b/drivers/gpu/drm/radeon/si.c
@@ -50,6 +50,7 @@ MODULE_FIRMWARE("radeon/tahiti_ce.bin");
 
				 MODULE_FIRMWARE("radeon/tahiti_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/tahiti_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/tahiti_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/tahiti_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/PITCAIRN_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/PITCAIRN_me.bin");
			
@@ -65,6 +66,7 @@ MODULE_FIRMWARE("radeon/pitcairn_ce.bin");
 
				 MODULE_FIRMWARE("radeon/pitcairn_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/pitcairn_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/pitcairn_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/pitcairn_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/VERDE_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/VERDE_me.bin");
			
@@ -80,6 +82,7 @@ MODULE_FIRMWARE("radeon/verde_ce.bin");
 
				 MODULE_FIRMWARE("radeon/verde_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/verde_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/verde_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/verde_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/OLAND_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/OLAND_me.bin");
			
@@ -95,6 +98,7 @@ MODULE_FIRMWARE("radeon/oland_ce.bin");
 
				 MODULE_FIRMWARE("radeon/oland_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/oland_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/oland_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/oland_k_smc.bin");
			
 
				 
			
 
				 MODULE_FIRMWARE("radeon/HAINAN_pfp.bin");
			
 
				 MODULE_FIRMWARE("radeon/HAINAN_me.bin");
			
@@ -110,6 +114,7 @@ MODULE_FIRMWARE("radeon/hainan_ce.bin");
 
				 MODULE_FIRMWARE("radeon/hainan_mc.bin");
			
 
				 MODULE_FIRMWARE("radeon/hainan_rlc.bin");
			
 
				 MODULE_FIRMWARE("radeon/hainan_smc.bin");
			
 
				+MODULE_FIRMWARE("radeon/hainan_k_smc.bin");
			
 
				 
			
 
				 static u32 si_get_cu_active_bitmap(struct radeon_device *rdev, u32 se, u32 sh);
			
 
				 static void si_pcie_gen3_enable(struct radeon_device *rdev);
			
@@ -1653,12 +1658,16 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 	char fw_name[30];
			
 
				 	int err;
			
 
				 	int new_fw = 0;
			
 
				+	bool new_smc = false;
			
 
				 
			
 
				 	DRM_DEBUG("\n");
			
 
				 
			
 
				 	switch (rdev->family) {
			
 
				 	case CHIP_TAHITI:
			
 
				 		chip_name = "TAHITI";
			
 
				+		/* XXX: figure out which Tahitis need the new ucode */
			
 
				+		if (0)
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "tahiti";
			
 
				 		pfp_req_size = SI_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = SI_PM4_UCODE_SIZE * 4;
			
@@ -1670,6 +1679,13 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 		break;
			
 
				 	case CHIP_PITCAIRN:
			
 
				 		chip_name = "PITCAIRN";
			
 
				+		if ((rdev->pdev->revision == 0x81) ||
			
 
				+		    (rdev->pdev->device == 0x6810) ||
			
 
				+		    (rdev->pdev->device == 0x6811) ||
			
 
				+		    (rdev->pdev->device == 0x6816) ||
			
 
				+		    (rdev->pdev->device == 0x6817) ||
			
 
				+		    (rdev->pdev->device == 0x6806))
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "pitcairn";
			
 
				 		pfp_req_size = SI_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = SI_PM4_UCODE_SIZE * 4;
			
@@ -1681,6 +1697,16 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 		break;
			
 
				 	case CHIP_VERDE:
			
 
				 		chip_name = "VERDE";
			
 
				+		if ((rdev->pdev->revision == 0x81) ||
			
 
				+		    (rdev->pdev->revision == 0x83) ||
			
 
				+		    (rdev->pdev->revision == 0x87) ||
			
 
				+		    (rdev->pdev->device == 0x6820) ||
			
 
				+		    (rdev->pdev->device == 0x6821) ||
			
 
				+		    (rdev->pdev->device == 0x6822) ||
			
 
				+		    (rdev->pdev->device == 0x6823) ||
			
 
				+		    (rdev->pdev->device == 0x682A) ||
			
 
				+		    (rdev->pdev->device == 0x682B))
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "verde";
			
 
				 		pfp_req_size = SI_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = SI_PM4_UCODE_SIZE * 4;
			
@@ -1692,6 +1718,13 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 		break;
			
 
				 	case CHIP_OLAND:
			
 
				 		chip_name = "OLAND";
			
 
				+		if ((rdev->pdev->revision == 0xC7) ||
			
 
				+		    (rdev->pdev->revision == 0x80) ||
			
 
				+		    (rdev->pdev->revision == 0x81) ||
			
 
				+		    (rdev->pdev->revision == 0x83) ||
			
 
				+		    (rdev->pdev->device == 0x6604) ||
			
 
				+		    (rdev->pdev->device == 0x6605))
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "oland";
			
 
				 		pfp_req_size = SI_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = SI_PM4_UCODE_SIZE * 4;
			
@@ -1702,6 +1735,13 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 		break;
			
 
				 	case CHIP_HAINAN:
			
 
				 		chip_name = "HAINAN";
			
 
				+		if ((rdev->pdev->revision == 0x81) ||
			
 
				+		    (rdev->pdev->revision == 0x83) ||
			
 
				+		    (rdev->pdev->revision == 0xC3) ||
			
 
				+		    (rdev->pdev->device == 0x6664) ||
			
 
				+		    (rdev->pdev->device == 0x6665) ||
			
 
				+		    (rdev->pdev->device == 0x6667))
			
 
				+			new_smc = true;
			
 
				 		new_chip_name = "hainan";
			
 
				 		pfp_req_size = SI_PFP_UCODE_SIZE * 4;
			
 
				 		me_req_size = SI_PM4_UCODE_SIZE * 4;
			
@@ -1847,7 +1887,10 @@ static int si_init_microcode(struct radeon_device *rdev)
 
				 		}
			
 
				 	}
			
 
				 
			
 
				-	snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", new_chip_name);
			
 
				+	if (new_smc)
			
 
				+		snprintf(fw_name, sizeof(fw_name), "radeon/%s_k_smc.bin", new_chip_name);
			
 
				+	else
			
 
				+		snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", new_chip_name);
			
 
				 	err = request_firmware(&rdev->smc_fw, fw_name, rdev->dev);
			
 
				 	if (err) {
			
 
				 		snprintf(fw_name, sizeof(fw_name), "radeon/%s_smc.bin", chip_name);
			
--- a/drivers/gpu/drm/ttm/ttm_bo.c
+++ b/drivers/gpu/drm/ttm/ttm_bo.c
@@ -147,9 +147,9 @@ static void ttm_bo_release_list(struct kref *list_kref)
 
				 	BUG_ON(!list_empty(&bo->lru));
			
 
				 	BUG_ON(!list_empty(&bo->ddestroy));
			
 
				 
			
 
				-	if (bo->ttm)
			
 
				-		ttm_tt_destroy(bo->ttm);
			
 
				+	ttm_tt_destroy(bo->ttm);
			
 
				 	atomic_dec(&bo->glob->bo_count);
			
 
				+	fence_put(bo->moving);
			
 
				 	if (bo->resv == &bo->ttm_resv)
			
 
				 		reservation_object_fini(&bo->ttm_resv);
			
 
				 	mutex_destroy(&bo->wu_mutex);
			
@@ -360,7 +360,8 @@ static int ttm_bo_handle_move_mem(struct ttm_buffer_object *bo,
 
				 		ret = bdev->driver->move(bo, evict, interruptible,
			
 
				 					 no_wait_gpu, mem);
			
 
				 	else
			
 
				-		ret = ttm_bo_move_memcpy(bo, evict, no_wait_gpu, mem);
			
 
				+		ret = ttm_bo_move_memcpy(bo, evict, interruptible,
			
 
				+					 no_wait_gpu, mem);
			
 
				 
			
 
				 	if (ret) {
			
 
				 		if (bdev->driver->move_notify) {
			
@@ -396,8 +397,7 @@ moved:
 
				 
			
 
				 out_err:
			
 
				 	new_man = &bdev->man[bo->mem.mem_type];
			
 
				-	if ((new_man->flags & TTM_MEMTYPE_FLAG_FIXED) && bo->ttm) {
			
 
				-		ttm_tt_unbind(bo->ttm);
			
 
				+	if (new_man->flags & TTM_MEMTYPE_FLAG_FIXED) {
			
 
				 		ttm_tt_destroy(bo->ttm);
			
 
				 		bo->ttm = NULL;
			
 
				 	}
			
@@ -418,11 +418,8 @@ static void ttm_bo_cleanup_memtype_use(struct ttm_buffer_object *bo)
 
				 	if (bo->bdev->driver->move_notify)
			
 
				 		bo->bdev->driver->move_notify(bo, NULL);
			
 
				 
			
 
				-	if (bo->ttm) {
			
 
				-		ttm_tt_unbind(bo->ttm);
			
 
				-		ttm_tt_destroy(bo->ttm);
			
 
				-		bo->ttm = NULL;
			
 
				-	}
			
 
				+	ttm_tt_destroy(bo->ttm);
			
 
				+	bo->ttm = NULL;
			
 
				 	ttm_bo_mem_put(bo, &bo->mem);
			
 
				 
			
 
				 	ww_mutex_unlock (&bo->resv->lock);
			
@@ -688,15 +685,6 @@ static int ttm_bo_evict(struct ttm_buffer_object *bo, bool interruptible,
 
				 	struct ttm_placement placement;
			
 
				 	int ret = 0;
			
 
				 
			
 
				-	ret = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				-
			
 
				-	if (unlikely(ret != 0)) {
			
 
				-		if (ret != -ERESTARTSYS) {
			
 
				-			pr_err("Failed to expire sync object before buffer eviction\n");
			
 
				-		}
			
 
				-		goto out;
			
 
				-	}
			
 
				-
			
 
				 	lockdep_assert_held(&bo->resv->lock.base);
			
 
				 
			
 
				 	evict_mem = bo->mem;
			
@@ -720,7 +708,7 @@ static int ttm_bo_evict(struct ttm_buffer_object *bo, bool interruptible,
 
				 
			
 
				 	ret = ttm_bo_handle_move_mem(bo, &evict_mem, true, interruptible,
			
 
				 				     no_wait_gpu);
			
 
				-	if (ret) {
			
 
				+	if (unlikely(ret)) {
			
 
				 		if (ret != -ERESTARTSYS)
			
 
				 			pr_err("Buffer eviction failed\n");
			
 
				 		ttm_bo_mem_put(bo, &evict_mem);
			
@@ -799,6 +787,34 @@ void ttm_bo_mem_put(struct ttm_buffer_object *bo, struct ttm_mem_reg *mem)
 
				 }
			
 
				 EXPORT_SYMBOL(ttm_bo_mem_put);
			
 
				 
			
 
				+/**
			
 
				+ * Add the last move fence to the BO and reserve a new shared slot.
			
 
				+ */
			
 
				+static int ttm_bo_add_move_fence(struct ttm_buffer_object *bo,
			
 
				+				 struct ttm_mem_type_manager *man,
			
 
				+				 struct ttm_mem_reg *mem)
			
 
				+{
			
 
				+	struct fence *fence;
			
 
				+	int ret;
			
 
				+
			
 
				+	spin_lock(&man->move_lock);
			
 
				+	fence = fence_get(man->move);
			
 
				+	spin_unlock(&man->move_lock);
			
 
				+
			
 
				+	if (fence) {
			
 
				+		reservation_object_add_shared_fence(bo->resv, fence);
			
 
				+
			
 
				+		ret = reservation_object_reserve_shared(bo->resv);
			
 
				+		if (unlikely(ret))
			
 
				+			return ret;
			
 
				+
			
 
				+		fence_put(bo->moving);
			
 
				+		bo->moving = fence;
			
 
				+	}
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+
			
 
				 /**
			
 
				  * Repeatedly evict memory from the LRU for @mem_type until we create enough
			
 
				  * space, or we've evicted everything and there isn't enough space.
			
@@ -825,10 +841,8 @@ static int ttm_bo_mem_force_space(struct ttm_buffer_object *bo,
 
				 		if (unlikely(ret != 0))
			
 
				 			return ret;
			
 
				 	} while (1);
			
 
				-	if (mem->mm_node == NULL)
			
 
				-		return -ENOMEM;
			
 
				 	mem->mem_type = mem_type;
			
 
				-	return 0;
			
 
				+	return ttm_bo_add_move_fence(bo, man, mem);
			
 
				 }
			
 
				 
			
 
				 static uint32_t ttm_bo_select_caching(struct ttm_mem_type_manager *man,
			
@@ -898,6 +912,10 @@ int ttm_bo_mem_space(struct ttm_buffer_object *bo,
 
				 	bool has_erestartsys = false;
			
 
				 	int i, ret;
			
 
				 
			
 
				+	ret = reservation_object_reserve_shared(bo->resv);
			
 
				+	if (unlikely(ret))
			
 
				+		return ret;
			
 
				+
			
 
				 	mem->mm_node = NULL;
			
 
				 	for (i = 0; i < placement->num_placement; ++i) {
			
 
				 		const struct ttm_place *place = &placement->placement[i];
			
@@ -931,9 +949,15 @@ int ttm_bo_mem_space(struct ttm_buffer_object *bo,
 
				 		ret = (*man->func->get_node)(man, bo, place, mem);
			
 
				 		if (unlikely(ret))
			
 
				 			return ret;
			
 
				-		
			
 
				-		if (mem->mm_node)
			
 
				+
			
 
				+		if (mem->mm_node) {
			
 
				+			ret = ttm_bo_add_move_fence(bo, man, mem);
			
 
				+			if (unlikely(ret)) {
			
 
				+				(*man->func->put_node)(man, mem);
			
 
				+				return ret;
			
 
				+			}
			
 
				 			break;
			
 
				+		}
			
 
				 	}
			
 
				 
			
 
				 	if ((type_ok && (mem_type == TTM_PL_SYSTEM)) || mem->mm_node) {
			
@@ -1000,20 +1024,6 @@ static int ttm_bo_move_buffer(struct ttm_buffer_object *bo,
 
				 
			
 
				 	lockdep_assert_held(&bo->resv->lock.base);
			
 
				 
			
 
				-	/*
			
 
				-	 * Don't wait for the BO on initial allocation. This is important when
			
 
				-	 * the BO has an imported reservation object.
			
 
				-	 */
			
 
				-	if (bo->mem.mem_type != TTM_PL_SYSTEM || bo->ttm != NULL) {
			
 
				-		/*
			
 
				-		 * FIXME: It's possible to pipeline buffer moves.
			
 
				-		 * Have the driver move function wait for idle when necessary,
			
 
				-		 * instead of doing it here.
			
 
				-		 */
			
 
				-		ret = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				-		if (ret)
			
 
				-			return ret;
			
 
				-	}
			
 
				 	mem.num_pages = bo->num_pages;
			
 
				 	mem.size = mem.num_pages << PAGE_SHIFT;
			
 
				 	mem.page_alignment = bo->mem.page_alignment;
			
@@ -1165,7 +1175,7 @@ int ttm_bo_init(struct ttm_bo_device *bdev,
 
				 	bo->mem.page_alignment = page_alignment;
			
 
				 	bo->mem.bus.io_reserved_vm = false;
			
 
				 	bo->mem.bus.io_reserved_count = 0;
			
 
				-	bo->priv_flags = 0;
			
 
				+	bo->moving = NULL;
			
 
				 	bo->mem.placement = (TTM_PL_FLAG_SYSTEM | TTM_PL_FLAG_CACHED);
			
 
				 	bo->persistent_swap_storage = persistent_swap_storage;
			
 
				 	bo->acc_size = acc_size;
			
@@ -1277,6 +1287,7 @@ static int ttm_bo_force_list_clean(struct ttm_bo_device *bdev,
 
				 {
			
 
				 	struct ttm_mem_type_manager *man = &bdev->man[mem_type];
			
 
				 	struct ttm_bo_global *glob = bdev->glob;
			
 
				+	struct fence *fence;
			
 
				 	int ret;
			
 
				 
			
 
				 	/*
			
@@ -1297,6 +1308,23 @@ static int ttm_bo_force_list_clean(struct ttm_bo_device *bdev,
 
				 		spin_lock(&glob->lru_lock);
			
 
				 	}
			
 
				 	spin_unlock(&glob->lru_lock);
			
 
				+
			
 
				+	spin_lock(&man->move_lock);
			
 
				+	fence = fence_get(man->move);
			
 
				+	spin_unlock(&man->move_lock);
			
 
				+
			
 
				+	if (fence) {
			
 
				+		ret = fence_wait(fence, false);
			
 
				+		fence_put(fence);
			
 
				+		if (ret) {
			
 
				+			if (allow_errors) {
			
 
				+				return ret;
			
 
				+			} else {
			
 
				+				pr_err("Cleanup eviction failed\n");
			
 
				+			}
			
 
				+		}
			
 
				+	}
			
 
				+
			
 
				 	return 0;
			
 
				 }
			
 
				 
			
@@ -1316,6 +1344,7 @@ int ttm_bo_clean_mm(struct ttm_bo_device *bdev, unsigned mem_type)
 
				 		       mem_type);
			
 
				 		return ret;
			
 
				 	}
			
 
				+	fence_put(man->move);
			
 
				 
			
 
				 	man->use_type = false;
			
 
				 	man->has_type = false;
			
@@ -1361,6 +1390,7 @@ int ttm_bo_init_mm(struct ttm_bo_device *bdev, unsigned type,
 
				 	man->io_reserve_fastpath = true;
			
 
				 	man->use_io_reserve_lru = false;
			
 
				 	mutex_init(&man->io_reserve_mutex);
			
 
				+	spin_lock_init(&man->move_lock);
			
 
				 	INIT_LIST_HEAD(&man->io_reserve_lru);
			
 
				 
			
 
				 	ret = bdev->driver->init_mem_type(bdev, type, man);
			
@@ -1379,6 +1409,7 @@ int ttm_bo_init_mm(struct ttm_bo_device *bdev, unsigned type,
 
				 	man->size = p_size;
			
 
				 
			
 
				 	INIT_LIST_HEAD(&man->lru);
			
 
				+	man->move = NULL;
			
 
				 
			
 
				 	return 0;
			
 
				 }
			
@@ -1572,47 +1603,17 @@ EXPORT_SYMBOL(ttm_bo_unmap_virtual);
 
				 int ttm_bo_wait(struct ttm_buffer_object *bo,
			
 
				 		bool interruptible, bool no_wait)
			
 
				 {
			
 
				-	struct reservation_object_list *fobj;
			
 
				-	struct reservation_object *resv;
			
 
				-	struct fence *excl;
			
 
				-	long timeout = 15 * HZ;
			
 
				-	int i;
			
 
				-
			
 
				-	resv = bo->resv;
			
 
				-	fobj = reservation_object_get_list(resv);
			
 
				-	excl = reservation_object_get_excl(resv);
			
 
				-	if (excl) {
			
 
				-		if (!fence_is_signaled(excl)) {
			
 
				-			if (no_wait)
			
 
				-				return -EBUSY;
			
 
				-
			
 
				-			timeout = fence_wait_timeout(excl,
			
 
				-						     interruptible, timeout);
			
 
				-		}
			
 
				-	}
			
 
				-
			
 
				-	for (i = 0; fobj && timeout > 0 && i < fobj->shared_count; ++i) {
			
 
				-		struct fence *fence;
			
 
				-		fence = rcu_dereference_protected(fobj->shared[i],
			
 
				-						reservation_object_held(resv));
			
 
				-
			
 
				-		if (!fence_is_signaled(fence)) {
			
 
				-			if (no_wait)
			
 
				-				return -EBUSY;
			
 
				-
			
 
				-			timeout = fence_wait_timeout(fence,
			
 
				-						     interruptible, timeout);
			
 
				-		}
			
 
				-	}
			
 
				+	long timeout = no_wait ? 0 : 15 * HZ;
			
 
				 
			
 
				+	timeout = reservation_object_wait_timeout_rcu(bo->resv, true,
			
 
				+						      interruptible, timeout);
			
 
				 	if (timeout < 0)
			
 
				 		return timeout;
			
 
				 
			
 
				 	if (timeout == 0)
			
 
				 		return -EBUSY;
			
 
				 
			
 
				-	reservation_object_add_excl_fence(resv, NULL);
			
 
				-	clear_bit(TTM_BO_PRIV_FLAG_MOVING, &bo->priv_flags);
			
 
				+	reservation_object_add_excl_fence(bo->resv, NULL);
			
 
				 	return 0;
			
 
				 }
			
 
				 EXPORT_SYMBOL(ttm_bo_wait);
			
@@ -1682,14 +1683,9 @@ static int ttm_bo_swapout(struct ttm_mem_shrink *shrink)
 
				 	ttm_bo_list_ref_sub(bo, put_count, true);
			
 
				 
			
 
				 	/**
			
 
				-	 * Wait for GPU, then move to system cached.
			
 
				+	 * Move to system cached
			
 
				 	 */
			
 
				 
			
 
				-	ret = ttm_bo_wait(bo, false, false);
			
 
				-
			
 
				-	if (unlikely(ret != 0))
			
 
				-		goto out;
			
 
				-
			
 
				 	if ((bo->mem.placement & swap_placement) != swap_placement) {
			
 
				 		struct ttm_mem_reg evict_mem;
			
 
				 
			
@@ -1704,6 +1700,14 @@ static int ttm_bo_swapout(struct ttm_mem_shrink *shrink)
 
				 			goto out;
			
 
				 	}
			
 
				 
			
 
				+	/**
			
 
				+	 * Make sure BO is idle.
			
 
				+	 */
			
 
				+
			
 
				+	ret = ttm_bo_wait(bo, false, false);
			
 
				+	if (unlikely(ret != 0))
			
 
				+		goto out;
			
 
				+
			
 
				 	ttm_bo_unmap_virtual(bo);
			
 
				 
			
 
				 	/**
			
--- a/drivers/gpu/drm/ttm/ttm_bo_util.c
+++ b/drivers/gpu/drm/ttm/ttm_bo_util.c
@@ -53,7 +53,6 @@ int ttm_bo_move_ttm(struct ttm_buffer_object *bo,
 
				 	int ret;
			
 
				 
			
 
				 	if (old_mem->mem_type != TTM_PL_SYSTEM) {
			
 
				-		ttm_tt_unbind(ttm);
			
 
				 		ttm_bo_free_old_node(bo);
			
 
				 		ttm_flag_masked(&old_mem->placement, TTM_PL_FLAG_SYSTEM,
			
 
				 				TTM_PL_MASK_MEM);
			
@@ -321,7 +320,8 @@ static int ttm_copy_ttm_io_page(struct ttm_tt *ttm, void *dst,
 
				 }
			
 
				 
			
 
				 int ttm_bo_move_memcpy(struct ttm_buffer_object *bo,
			
 
				-		       bool evict, bool no_wait_gpu,
			
 
				+		       bool evict, bool interruptible,
			
 
				+		       bool no_wait_gpu,
			
 
				 		       struct ttm_mem_reg *new_mem)
			
 
				 {
			
 
				 	struct ttm_bo_device *bdev = bo->bdev;
			
@@ -337,6 +337,10 @@ int ttm_bo_move_memcpy(struct ttm_buffer_object *bo,
 
				 	unsigned long add = 0;
			
 
				 	int dir;
			
 
				 
			
 
				+	ret = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				 	ret = ttm_mem_reg_ioremap(bdev, old_mem, &old_iomap);
			
 
				 	if (ret)
			
 
				 		return ret;
			
@@ -401,8 +405,7 @@ out2:
 
				 	*old_mem = *new_mem;
			
 
				 	new_mem->mm_node = NULL;
			
 
				 
			
 
				-	if ((man->flags & TTM_MEMTYPE_FLAG_FIXED) && (ttm != NULL)) {
			
 
				-		ttm_tt_unbind(ttm);
			
 
				+	if (man->flags & TTM_MEMTYPE_FLAG_FIXED) {
			
 
				 		ttm_tt_destroy(ttm);
			
 
				 		bo->ttm = NULL;
			
 
				 	}
			
@@ -462,6 +465,7 @@ static int ttm_buffer_object_transfer(struct ttm_buffer_object *bo,
 
				 	INIT_LIST_HEAD(&fbo->lru);
			
 
				 	INIT_LIST_HEAD(&fbo->swap);
			
 
				 	INIT_LIST_HEAD(&fbo->io_reserve_lru);
			
 
				+	fbo->moving = NULL;
			
 
				 	drm_vma_node_reset(&fbo->vma_node);
			
 
				 	atomic_set(&fbo->cpu_writers, 0);
			
 
				 
			
@@ -634,7 +638,6 @@ EXPORT_SYMBOL(ttm_bo_kunmap);
 
				 int ttm_bo_move_accel_cleanup(struct ttm_buffer_object *bo,
			
 
				 			      struct fence *fence,
			
 
				 			      bool evict,
			
 
				-			      bool no_wait_gpu,
			
 
				 			      struct ttm_mem_reg *new_mem)
			
 
				 {
			
 
				 	struct ttm_bo_device *bdev = bo->bdev;
			
@@ -649,9 +652,7 @@ int ttm_bo_move_accel_cleanup(struct ttm_buffer_object *bo,
 
				 		if (ret)
			
 
				 			return ret;
			
 
				 
			
 
				-		if ((man->flags & TTM_MEMTYPE_FLAG_FIXED) &&
			
 
				-		    (bo->ttm != NULL)) {
			
 
				-			ttm_tt_unbind(bo->ttm);
			
 
				+		if (man->flags & TTM_MEMTYPE_FLAG_FIXED) {
			
 
				 			ttm_tt_destroy(bo->ttm);
			
 
				 			bo->ttm = NULL;
			
 
				 		}
			
@@ -665,7 +666,8 @@ int ttm_bo_move_accel_cleanup(struct ttm_buffer_object *bo,
 
				 		 * operation has completed.
			
 
				 		 */
			
 
				 
			
 
				-		set_bit(TTM_BO_PRIV_FLAG_MOVING, &bo->priv_flags);
			
 
				+		fence_put(bo->moving);
			
 
				+		bo->moving = fence_get(fence);
			
 
				 
			
 
				 		ret = ttm_buffer_object_transfer(bo, &ghost_obj);
			
 
				 		if (ret)
			
@@ -694,3 +696,95 @@ int ttm_bo_move_accel_cleanup(struct ttm_buffer_object *bo,
 
				 	return 0;
			
 
				 }
			
 
				 EXPORT_SYMBOL(ttm_bo_move_accel_cleanup);
			
 
				+
			
 
				+int ttm_bo_pipeline_move(struct ttm_buffer_object *bo,
			
 
				+			 struct fence *fence, bool evict,
			
 
				+			 struct ttm_mem_reg *new_mem)
			
 
				+{
			
 
				+	struct ttm_bo_device *bdev = bo->bdev;
			
 
				+	struct ttm_mem_reg *old_mem = &bo->mem;
			
 
				+
			
 
				+	struct ttm_mem_type_manager *from = &bdev->man[old_mem->mem_type];
			
 
				+	struct ttm_mem_type_manager *to = &bdev->man[new_mem->mem_type];
			
 
				+
			
 
				+	int ret;
			
 
				+
			
 
				+	reservation_object_add_excl_fence(bo->resv, fence);
			
 
				+
			
 
				+	if (!evict) {
			
 
				+		struct ttm_buffer_object *ghost_obj;
			
 
				+
			
 
				+		/**
			
 
				+		 * This should help pipeline ordinary buffer moves.
			
 
				+		 *
			
 
				+		 * Hang old buffer memory on a new buffer object,
			
 
				+		 * and leave it to be released when the GPU
			
 
				+		 * operation has completed.
			
 
				+		 */
			
 
				+
			
 
				+		fence_put(bo->moving);
			
 
				+		bo->moving = fence_get(fence);
			
 
				+
			
 
				+		ret = ttm_buffer_object_transfer(bo, &ghost_obj);
			
 
				+		if (ret)
			
 
				+			return ret;
			
 
				+
			
 
				+		reservation_object_add_excl_fence(ghost_obj->resv, fence);
			
 
				+
			
 
				+		/**
			
 
				+		 * If we're not moving to fixed memory, the TTM object
			
 
				+		 * needs to stay alive. Otherwhise hang it on the ghost
			
 
				+		 * bo to be unbound and destroyed.
			
 
				+		 */
			
 
				+
			
 
				+		if (!(to->flags & TTM_MEMTYPE_FLAG_FIXED))
			
 
				+			ghost_obj->ttm = NULL;
			
 
				+		else
			
 
				+			bo->ttm = NULL;
			
 
				+
			
 
				+		ttm_bo_unreserve(ghost_obj);
			
 
				+		ttm_bo_unref(&ghost_obj);
			
 
				+
			
 
				+	} else if (from->flags & TTM_MEMTYPE_FLAG_FIXED) {
			
 
				+
			
 
				+		/**
			
 
				+		 * BO doesn't have a TTM we need to bind/unbind. Just remember
			
 
				+		 * this eviction and free up the allocation
			
 
				+		 */
			
 
				+
			
 
				+		spin_lock(&from->move_lock);
			
 
				+		if (!from->move || fence_is_later(fence, from->move)) {
			
 
				+			fence_put(from->move);
			
 
				+			from->move = fence_get(fence);
			
 
				+		}
			
 
				+		spin_unlock(&from->move_lock);
			
 
				+
			
 
				+		ttm_bo_free_old_node(bo);
			
 
				+
			
 
				+		fence_put(bo->moving);
			
 
				+		bo->moving = fence_get(fence);
			
 
				+
			
 
				+	} else {
			
 
				+		/**
			
 
				+		 * Last resort, wait for the move to be completed.
			
 
				+		 *
			
 
				+		 * Should never happen in pratice.
			
 
				+		 */
			
 
				+
			
 
				+		ret = ttm_bo_wait(bo, false, false);
			
 
				+		if (ret)
			
 
				+			return ret;
			
 
				+
			
 
				+		if (to->flags & TTM_MEMTYPE_FLAG_FIXED) {
			
 
				+			ttm_tt_destroy(bo->ttm);
			
 
				+			bo->ttm = NULL;
			
 
				+		}
			
 
				+		ttm_bo_free_old_node(bo);
			
 
				+	}
			
 
				+
			
 
				+	*old_mem = *new_mem;
			
 
				+	new_mem->mm_node = NULL;
			
 
				+
			
 
				+	return 0;
			
 
				+}
			
 
				+EXPORT_SYMBOL(ttm_bo_pipeline_move);
			
--- a/drivers/gpu/drm/ttm/ttm_bo_vm.c
+++ b/drivers/gpu/drm/ttm/ttm_bo_vm.c
@@ -48,15 +48,14 @@ static int ttm_bo_vm_fault_idle(struct ttm_buffer_object *bo,
 
				 {
			
 
				 	int ret = 0;
			
 
				 
			
 
				-	if (likely(!test_bit(TTM_BO_PRIV_FLAG_MOVING, &bo->priv_flags)))
			
 
				+	if (likely(!bo->moving))
			
 
				 		goto out_unlock;
			
 
				 
			
 
				 	/*
			
 
				 	 * Quick non-stalling check for idle.
			
 
				 	 */
			
 
				-	ret = ttm_bo_wait(bo, false, true);
			
 
				-	if (likely(ret == 0))
			
 
				-		goto out_unlock;
			
 
				+	if (fence_is_signaled(bo->moving))
			
 
				+		goto out_clear;
			
 
				 
			
 
				 	/*
			
 
				 	 * If possible, avoid waiting for GPU with mmap_sem
			
@@ -68,17 +67,23 @@ static int ttm_bo_vm_fault_idle(struct ttm_buffer_object *bo,
 
				 			goto out_unlock;
			
 
				 
			
 
				 		up_read(&vma->vm_mm->mmap_sem);
			
 
				-		(void) ttm_bo_wait(bo, true, false);
			
 
				+		(void) fence_wait(bo->moving, true);
			
 
				 		goto out_unlock;
			
 
				 	}
			
 
				 
			
 
				 	/*
			
 
				 	 * Ordinary wait.
			
 
				 	 */
			
 
				-	ret = ttm_bo_wait(bo, true, false);
			
 
				-	if (unlikely(ret != 0))
			
 
				+	ret = fence_wait(bo->moving, true);
			
 
				+	if (unlikely(ret != 0)) {
			
 
				 		ret = (ret != -ERESTARTSYS) ? VM_FAULT_SIGBUS :
			
 
				 			VM_FAULT_NOPAGE;
			
 
				+		goto out_unlock;
			
 
				+	}
			
 
				+
			
 
				+out_clear:
			
 
				+	fence_put(bo->moving);
			
 
				+	bo->moving = NULL;
			
 
				 
			
 
				 out_unlock:
			
 
				 	return ret;
			
--- a/drivers/gpu/drm/ttm/ttm_tt.c
+++ b/drivers/gpu/drm/ttm/ttm_tt.c
@@ -166,11 +166,15 @@ EXPORT_SYMBOL(ttm_tt_set_placement_caching);
 
				 
			
 
				 void ttm_tt_destroy(struct ttm_tt *ttm)
			
 
				 {
			
 
				-	if (unlikely(ttm == NULL))
			
 
				+	int ret;
			
 
				+
			
 
				+	if (ttm == NULL)
			
 
				 		return;
			
 
				 
			
 
				 	if (ttm->state == tt_bound) {
			
 
				-		ttm_tt_unbind(ttm);
			
 
				+		ret = ttm->func->unbind(ttm);
			
 
				+		BUG_ON(ret);
			
 
				+		ttm->state = tt_unbound;
			
 
				 	}
			
 
				 
			
 
				 	if (ttm->state == tt_unbound)
			
@@ -251,17 +255,6 @@ void ttm_dma_tt_fini(struct ttm_dma_tt *ttm_dma)
 
				 }
			
 
				 EXPORT_SYMBOL(ttm_dma_tt_fini);
			
 
				 
			
 
				-void ttm_tt_unbind(struct ttm_tt *ttm)
			
 
				-{
			
 
				-	int ret;
			
 
				-
			
 
				-	if (ttm->state == tt_bound) {
			
 
				-		ret = ttm->func->unbind(ttm);
			
 
				-		BUG_ON(ret);
			
 
				-		ttm->state = tt_unbound;
			
 
				-	}
			
 
				-}
			
 
				-
			
 
				 int ttm_tt_bind(struct ttm_tt *ttm, struct ttm_mem_reg *bo_mem)
			
 
				 {
			
 
				 	int ret = 0;
			
--- a/drivers/gpu/drm/virtio/virtgpu_ttm.c
+++ b/drivers/gpu/drm/virtio/virtgpu_ttm.c
@@ -375,6 +375,12 @@ static int virtio_gpu_bo_move(struct ttm_buffer_object *bo,
 
				 			      bool no_wait_gpu,
			
 
				 			      struct ttm_mem_reg *new_mem)
			
 
				 {
			
 
				+	int ret;
			
 
				+
			
 
				+	ret = ttm_bo_wait(bo, interruptible, no_wait_gpu);
			
 
				+	if (ret)
			
 
				+		return ret;
			
 
				+
			
 
				 	virtio_gpu_move_null(bo, new_mem);
			
 
				 	return 0;
			
 
				 }